Источники? «Введение» не нужно. Показать на примерах, включая задачи по машинному обучению!

Добавлены источники. Убрано «Введение». Добавлены примеры.

SOCR

SOCR (Statistics Online Computational Resource) представляет собой набор онлайн инструментов, а также интерактивных пособий для практического изучения и преподавания принципов статистического анализа и теории вероятностей. Инструменты SOCR включают в себя набор интерактивных Java-апплетов, вычислительных и графических средств. Все материалы и инструменты находятся в свободном доступе в Internet.

SOCR разработан в Калифорнийском Университете, Лос-Анджелес. Ресурсы SOCR признаны десятками международных электронных библиотек, профессиональными обществами и научными организациями, такими как: NDSL, Открытые Образовательные Ресурсы, Американская Математическая Ассоциация и Калифорнийская Цифровая Библиотека.

Главные компоненты

Образовательные и вычислительные компоненты SOCR включают в себя:

  • Distributions - интератктивные графики и калькуляторы 
  • Experiments - виртуальные компьютерные аналоги популярных игр и процессов
  • Analyses - коллекция стандартных доступных веб-инструментов для статистического анализа данных
  • Games - интерфейсы и имитационное моделирование реальных процессов 
  • Modeler - инструменты для настройки моделей распределений, полиномиальных и спектральных моделей
  • Graphs, Plots and Charts - комплексные веб-инструменты для разведочного анализа данных
  • Additional Tools - другие статистические средства и ресурсы 
  • SOCR Wiki - вики-ресурс 
  • Educational Materials and Hands-on Activities - образовательные материалы 
  • SOCR Statistical Consulting
  • Statistical Computing Libraries – локальная версия SOCR

Типы ресурсов

SOCR развивает, проверяет и распространяет четыре вида ресурсов:

  • Интерактивные вычислительные Java-апплеты
  • Учебные ресурсы: электронные учебники, пособия и т.д.
  • Учебная деятельность: интерактивные практические занятия
  • Видео пособия SOCR: общие и специфические видеоролики

Практические занятия (Activities)

План

1. Games

  • Interactive Scatterplot
  • Monty Hall Game
  • Galton Board Game

2. Charts

  • SOCR EM MixtureModelChart

3. Experiments

  • Dice Experiment
  • Poker Experiment
  • Мячи и Урны
  • Cards

Games

  • Интерактивный график рассеивания

В выпадающем списке компонента SOCR Games выберите Interactive Scatterplot. На скриншоте ниже показан общий вид и основные элементы апплета.

Interactive Scatterplot

Кликните на график для генерации двумерных данных. Выбранные точки показаны красным цветом на графике разброса, а их координаты записаны в первую таблицу. Вторая таблица дает среднее и стандартное отклонение x и y координат, а также корреляцию. На графике центр горизонтальной линии совпадает со средним по х координате. Линия простирается в обе стороны, показывая стандартное отклонение. Аналогично для y: центр вертикальной линии представляет собой среднее по входным y-координатам; линия продолжается в обе стороны в зависимости от стандартного отклонения. Наконец, на самом графике представлена линия регрессии, построенная методом наименьших квадратов.

  • Игра Монти Холл

В выпадающем списке компонента SOCR Games выберите Monty Hall Game. На скриншоте ниже показан общий вид и основные элементы апплета.

Monty Hall Game

В игре Монти Холла есть три двери; за одной из дверей находится автомобиль, а за двумя другими – козлы. Нажмите на кнопку Play для того, чтобы начать игру. Потом выберите дверь одним кликом. Ведущий программы откроет одну из двух других дверей. Наконец, выберите дверь снова (вы можете оставить ту же дверь или изменить решение). Выбранную вами дверь открывают, и вы либо выиграли, либо проиграли. В выпадающем списке может быть выбрана одна из двух стратегий ведущего. Согласно стандартной стратегии, ведущий всегда открывает дверь с козлом; в слепой стратегии (blind strategy) ведущий наугад открывает одну из двух доступных для него дверей. У нас есть три булевых переменных: G, S, W. Переменная G показывает исход, что ведущий открыл дверь с козлом; переменная S означает событие, что вы изменили свой выбор; и переменная W означает событие, что вы выиграли автомобиль. Эмпирическое распределение величины W показано на графике распределения и записывается в таблицу распределения.

  • Игра Доска Гальтона

В выпадающем списке компонента SOCR Games выберите Interactive Scatterplot. На скриншоте ниже показан общий вид и основные элементы апплета.

Galton Board Game

Игра создана для демонстрации центральной предельной теоремы. Доска Гальтона - это прототип многих современных игровых автоматов (например Патинко). Если кидать шарики в доску, то они будут падать в ячейки «по биномиальному распределению»:

Доска Гальтона. Биномиальное распределение

Игра SOCR позволяет вам самим выступить в роли «вероятности» и послать шарик в нужную вам ячейку. После чего программа выдаст вам вероятность, с которой шарик оказался бы в этой ячейке в условиях реального эксперимента.

Experiments

  • Dice Experiment

В выпадающем списке компонента SOCR Experiments выберите Dice Experiment. На скриншоте ниже показан общий вид и основные элементы апплета.

Dice Experiment

Эксперимент заключается в подбрасывании n-го количества костей, регулируемых одинаковыми распределениями вероятности. Вы можете задать свое распределение, кликнув на кнопку с изображением кости. Эта кнопка вызовет окно с вероятностями выпадения чисел, где вы сможете изменить их по своему желанию. При помощи ползунка можно увеличивать количество костей участвующих в эксперименте (вплоть до 30). После того, как эксперимент будет выполнен необходимое количество раз, в левой колонке таблицы снизу появится реальное распределение, рассчитанное из периодичности, с которой выпадали числа. Здесь же вы сможете сравнить их с предполагаемым распределением из правой колонки (стандартное, либо заданное вами перед началом эксперимента).

  • Poker Experiment

В выпадающем списке компонента SOCR Experiments выберите Poker Experiment. На скриншоте ниже показан общий вид и основные элементы апплета.

Poker Experiment

Эксперимент заключается в раздаче 5 карт из колоды в 52 карты с одинаковой вероятностью выпадения каждой карты. Суть эксперимента в том, чтобы увидеть как часто выпадают те или иные выигрышные комбинации в покере (дубль, три одинаковых, стрит, флэш и т.д.). В выпадающем списке (1) можно задать либо количество раздач, которые сделает компьютер, либо задать определенную комбинацию, которую компьютер будет пытаться получить каждый раз раздавая карты заново. Поставив в нем, например, значение «Stop at V=6», карты будут раздаваться до тех пор, пока не выпадет фулл хаус (V=1: пара одинаковых карт, V=2: две пары, V=3: три одинаковых карты, V=4: стрит, V=5: флэш, V=6: фулл хаус, V=7: четыре одинаковых, V=8: стрит флэш). Задав условие окончание эксперимента, нажмите на кнопку (2). После того, как эксперимент окончится в области (3) вы увидите распределение вероятности выпадения каждой из восьми комбинаций и вероятность их отсутствия. Эти данные вы затем можете сравнить с предполагаемой вероятностью их выпадения, используя таблицу (4), в левой колонке которой находится «идеальное» распределение, а в правой – распределение составленное на основании результатов проведенного вами эксперимента.

  • Мячи и урны

В выпадающем списке компонента SOCR Experiments выберите Balls and Baskets. На скриншоте ниже показан общий вид и основные элементы апплета.

Мячи и урны

Этот эксперимент позволяет моделировать такой популярный в теории вероятностей класс задач с разноцветными шарами и ящиками. Есть виртуальный ящик и два типа шаров - красные (успехи) и зеленые (отказы). Пользователь может контролировать общее число шаров в урне (N), количество красных шаров (R) и количество шаров для выборки из ящика (n). Предположим, что мы установили N=50, R=25 и n=10. Сколько успехов (красный шар) мы ожидаем получить в выборке 10 шариков? Это рассчитывается с помощью таблицы распределения, иллюстрируется диаграммами и графиками.

  • Cards

В выпадающем списке компонента SOCR Experiments выберите Cards. На скриншоте ниже показан общий вид и основные элементы апплета.

Мячи и урны

Этот эксперимент является более сложным. Он имитирует вытаскивание наугад n карт из стандартной колодой из 52 карт. Мы можем использовать эту модель для оценки различных вероятностей. (Например, вероятность получения пары карт одной масти или одинаковой стоимости).

Источники

Печать/экспорт