Структура пакетов прикладных программ

Стремительное развитие электронно-вычислительной техники, математического и программного обеспечения способствует ши­рокому проникновению ЭВМ во все сферы человеческой деятель­ности. Большие потенциальные возможности использования ЭВМ таятся и в области статистического моделирования. Опыт исполь­зования компьютеров в научно - исследовательской работе и обу­чении показывает, что компьютер, освобождая исследователя от рутинной вычислительной работы, позволяет применить гораздо более широкий спектр методов статистического анализа, сосре­доточить основное внимание на анализе и интерпретации резуль­татов исследований, воспользоваться методами графического представления результатов.

Существует немало различных программных систем для про­ведения математических расчетов. Для работы на компьютерах невысокой производительности, которые пока еще составляют значительную долю, можно использовать пакет Eureka. Для проведения вычислений на современных компьютерах следует рекомендовать, помимо Excel, широко распространенные пакеты MathCad, MathLab, Mathematica, Maple, Derive, Statistica.

Появление статистических программных пакетов сделало методы анализа данных более доступными и наглядными. Результатом появления этих мощных и удобных пакетов стало резкое расширение и из­менение круга потребителей методов анализа данных. Если раньше эти методы рассматривались главным образом как инструмент научных исследований, то начиная с середины 90-х годов основными пользователями статистических пакетов стали уже не научные, а коммерческие организации, а также правительственные и медицинские учреждения. Таким образом, методы анализа данных и статистические пакеты для компьютеров и других видов ЭВМ становятся типичным и общеупотребительным инструментом плановых, аналитических, маркетинговых отделов про­изводственных и торговых организаций, банков и страховых компаний, правительственных и медицинских учреждений. И даже представители мелкого бизнеса часто употребляют методы анализа данных либо само­стоятельно, либо обращаясь к услугам консультационных служб.

Число статистических пакетов, получивших распространение у нас в стране достаточно велико (несколько десятков) и спрос на них заметно возрос в середине 90-х годов. Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP, SAS, CSS, STATISTICA, S-plus, и др. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, MathCad, MathLab, Maple, и др. Проблема выбора наиболее подходящего пакета для определенной категории пользователей, круга решаемых задач, типа и возможностей компьютеров и т.д., весьма непроста.

Основную часть имеющихся статистических пакетов составляют специализированные пакеты и пакеты общего назначения.

Специализированные пакеты обычно содержат методы из одного-двух разделов статистики или методы, используемые в конкретной пред­метной области (контроль качества промышленной продукции, расчет страховых сумм и т.д.). Чаще всего встречаются пакеты для анализа временных рядов (например, Эвриста, МЕЗОЗАВР, MathCad, MathLab, Maple, Forecast Expert), регрессионного и факторного анализа, кластерного анализа, многомерного шкалирования. Обычно такие пакеты содержат весьма полный набор традиционных методов в своей области, а ино­гда включают также и оригинальные методы и алгоритмы. Как правило, пакет и его документация ори­ентированы на специалистов, хорошо знакомых с соответствующими методами. Применять такие пакеты целесообразно в тех случаях, когда требуется систематически решать задачи из той области, для которой предназначен специализированный пакет, а возможностей пакетов об­щего назначения недостаточно.

Пакеты же общего назначения менее конкретизированы в своей направленности. От­сутствие прямой ориентации на специфическую предметную область, широкий диапазон статистических методов, дружелюбный интерфейс пользователя привлекает в них не только начинающих пользователей, но и специалистов. Универсальность этих пакетов особенно полезна:

- на начальных этапах обработки, когда речь идет о подборе статистической модели или метода анализа данных;

- когда поведение статистических данных выходит за рамки ис­пользовавшейся ранее модели;

- в процессе обучения основам статистики.

Именно пакеты общего назначения составляют большинство практически используемых статистических программ.

Нельзя не обратить внимание на то, что вследствие большой популярности статистических методов обработки данных соответствующие средства стали включаться в табличные процессоры общего назначения (например, в Excel, Lotus 1-2-3 и т.д.), а также в некоторые базы данных. Наиболее часто в таких пакетах встречаются средства описательной статистики, методы регрессионного анализа, средства анализа временных рядов, сглаживания и прогнозирования.

Несмотря на полезность этих средств, не стоит оказывать им полного доверия. Речь, разумеется не идет о том, что в табличном процессоре или в базе данных неверно считается среднее или дисперсия — формулы для вычисления естественно, в них заложены правильные. Однако для более сложных задач типа проверки согласия или регрессионного анализа табличные процессоры и базы данных очень часто содержат грубейшие ошибки, приводящие к неправильности делаемых ими выводов. Поэтому обычно программирование статистических методов для таких программ сводится к переписыванию из какого-либо справочника по статистике соответству­ющих формул без учета их предназначения и границ применимости, что и приводит к нежелательным последствиям.

Таким образом, надежнее не использовать продвинутые статисти­ческие возможности табличных процессоров и баз данных, а экспорти­ровать анализируемые данные и обрабатывать их с помощью статисти­ческих пакетов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: