image

статистике

Что такое специализация по статистике:

Статистика — это специальность, связанная с сбором, организацией, анализом, интерпретацией и представлением данных. Когда статистика применяется к научной, промышленной или социальной проблеме, обычно начинают с изучения статистической совокупности или модели. Популяции могут быть различными группами людей или объектов, такими как «все люди, живущие в стране», или «каждый атом, составляющий кристалл». Статистика охватывает все аспекты данных, включая планирование сбора данных в рамках проектирования опросов и экспериментов.

Когда невозможно собрать данные переписи, статистики собирают данные, разрабатывая конкретные экспериментальные дизайны и выборки для опросов. Представительная выборка подтверждает, что выводы и заключения могут разумно распространяться с выборки на всю популяцию. Пилотное исследование включает в себя проведение измерений системы, обработку системы, а затем повторное измерение с использованием той же процедуры, чтобы определить, изменились ли значения измерений в результате манипуляций. В отличие от этого, наблюдательное исследование не включает эмпирической обработки.

В анализе данных используются два основных статистических метода: описательная статистика, которая обобщает данные из выборки с использованием таких показателей, как среднее или стандартное отклонение, и дедуктивная статистика, которая делает выводы из данных, подверженных случайным колебаниям (например, ошибки наблюдения, вариация выборки). Описательная статистика часто касается двух наборов распределительных характеристик (выборки или общества): центральной тенденции (или положения), которая стремится описать центральное или типичное значение распределения, и дисперсии (или вариации), которая отличает степень, в которой члены распределения отклоняются друг от друга. Семантика математической статистики выполняется в рамках теории вероятностей, которая занимается анализом случайных явлений.

Стандартная статистическая процедура включает сбор данных, который приводит к проверке отношения между двумя наборами статистических данных или набором данных и составными данными, полученными из идеальной модели. Для статистической связи между двумя наборами данных предложена гипотеза, которая сравнивается с альтернативой идеальной нулевой гипотезы, предполагающей отсутствие связи между двумя наборами данных. Нулевая гипотеза отвергается или опровергается с помощью статистических тестов, которые определяют значение ошибки, которую можно доказать, учитывая данные, используемые в тесте. Работая на основе предположения о нулевой гипотезе, выявляют две основные формы ошибок: ошибки типа I (нулевая гипотеза была неправомерно отвергнута с «ложной положительностью») и ошибки типа II (неудача невыполненной гипотезы и утрата реальной связи между популяциями — «ложная отрицательность»). Возникли многочисленные проблемы, связанные с этой системой, начиная от получения достаточного размера выборки для определения соответствующей нулевой гипотезы.

Измерения, генерирующие статистические данные, также подвержены ошибкам. Многие из этих ошибок классифицируются как случайные (шум) или систематические (смещение), но также могут возникать и другие типы ошибок (например, серьезная ошибка, когда аналитик сообщает неправильные единицы измерения). Наличие недостающих данных или контроля может привести к смещению оценок, и были разработаны специальные методы для решения этих проблем.

История статистики:

Ранние работы по статистическому выводу датируются арабскими математиками и криптографами в период Золотого века ислама между 8 и 13 веками. Хеброн (717-786) написал книгу о шифровании, в которой содержится первое использование доказательств и сочетаний для перечисления всех возможных арабских слов с гласными и без. В книге также подробно описано, как используется частотный анализ для расшифровки зашифрованных сообщений. Канадец также впервые использовал статистический вывод, в то время как он и другие арабские криптографы разработали ранние статистические методы для расшифровки зашифрованных сообщений. Ибн Адлан (1187-1268) впоследствии сделал важный вклад в использование размера выборки в частотном анализе.

Ранние европейские работы по статистике восходят к 1663 году, когда Джон Грант опубликовал «Естественные и политические наблюдения о счетах смертности». Первоначальное применение статистического мышления сосредоточилось на необходимости государств разрабатывать собственную политику в области демографических и экономических данных, а следовательно, и собственную статистику. Специализация в области статистики расширилась в начале XIX века и включала сбор и анализ данных в целом. Статистика теперь широко используется в государственных учреждениях, бизнесе, естественных и социальных науках. Математические основы современной статистики были разработаны в 17 веке с развитием теории вероятностей Джироламо Кардано, Блезом Паскалем и Пьером де Верма. Математическая теория вероятностей возникла из изучения азартных игр, хотя концепция вероятности уже была испытана в средневековом праве и философами, такими как Хуан Карамуэль. Адриен-Мари Лежандр впервые описал метод наименьших квадратов в 1805 году, а Карл Пирсон стал основателем статистики.

Современная область статистики возникла в конце 19 и начале 20 века в три этапа. Первая волна, в начале века, была возглавлена работами Франсиса Галтона и Карла Пирсона, которые трансформировали статистику в строгую математическую систему, используемую для анализа, не только в науке, но и в промышленности и политике. Вклад Галтона включал введение понятий стандартного отклонения, корреляции, регрессионного анализа и применение этих методов для изучения различных человеческих характеристик — длины, веса, длительности моргания и т. д. Метод моментов для подгонки распределений к выборкам и распространение Пирсона среди прочего. Галтон и Пирсон основали журнал Biometrika как первый журнал математической и биометрической статистики (тогда называемый биометрическим) и основали первый университетский статистический факультет в Университетском колледже Лондона.

Рональд Фишер ввел термин «нулевая гипотеза» в эксперименте по дегустации чая для леди, который «не был доказан или опровергнут, но вероятно был опровергнут во время эксперимента».

Уильям Сили Госсет начал вторую волну 2000-х годов, кульминировавшую в работах Рональда Фишера, который написал учебники, которые должны были определить академическую дисциплину в университетах по всему миру. Наиболее важные публикации Фишера — это его основополагающая статья 1918 года «О взаимоотношениях родственников на основе менделевского наследования» (первая статья, использующая статистический термин «вариация»), его классическая работа 1925 года «Статистические методы для исследователей», а также «Дизайн экспериментов» 1935 года, где он разработал строгий дизайн экспериментальных моделей. Он создал концепции достаточности, дополнительных статистик, линейного профиля Фишера и информации Фишера. В своей книге 1930 года «Генетическая теория естественного отбора» статистика была применена к различным биологическим концепциям, таким как принцип Фишера (который А. В. Эдвардс назвал «возможно, самым известным аргументом в эволюционной биологии») и бегство Фишера, концепция в сексуальном отборе о позитивности, которая обнаружила влияние неограниченных реакций в эволюции.

Последняя волна, которая фактически видела уточнение и расширение предыдущих достижений, возникла из совместной работы Эгона Пирсона и Ежи Неймана в 1930-х годах. Они ввели понятия ошибки типа II, мощности теста и доверительных интервалов. В 1934 году Ежи Нейман показал, что стратифицированная рандомизированная выборка была в целом лучшим методом оценки, чем целевая выборка (квоты). Использование современных компьютеров ускорило проведение масштабных статистических расчетов и сделало это возможным.

Значение изучения специализации по статистике:

Область статистики — это изучение данных. Знание статистики помогает использовать соответствующие методы сбора данных, проводить правильные анализы и эффективно представлять результаты. Статистика — это критический процесс в том, как мы делаем открытия в науке, принимаем решения на основе данных и строим прогнозы. Статистика позволяет глубже понять явления.

Я освещаю две основные причины, почему изучение статистики так важно в современном обществе. Во-первых, статистики являются доказательством, извлеченным из данных, и помогают обнаруживать общие проблемы, которые могут привести к неверным выводам. Во-вторых, с учетом растущего значения принятия решений и высказываний на основе данных, важно уметь критически оценивать качество анализа, который предоставляют другие.

Курсы по статистике:

Моделирование и статистические выборки Современная алгебра Математические уравнения Экономическая статистика Экономическое планирование Перепись населения Статистические системы и модели Эконометрика Числовой анализ Сельскохозяйственная статистика Финансовая экономика Программы и методы статистического анализа Экономика глобализации.

Сферы работы для специальности «Статистика»:

Банки Компании и офисы статистического анализа Страховые компании Компании в сфере вычислений Финансовые учреждения Фриланс Фондовая биржа Экономист