Зарегистрироваться
Восстановить пароль
FAQ по входу

Маунт Джордж. Погружение в аналитику данных. От Excel к Python и R

  • Файл формата pdf
  • размером 19,72 МБ
  • Добавлен пользователем
  • Описание отредактировано
Маунт Джордж. Погружение в аналитику данных. От Excel к Python и R
СПб.: БХВ-Петербург, 2023. — 224 с.: ил. — ISBN 978-5-9775-6866-1.
В книге приводятся практические приемы анализа данных. Рассказано, как исследовать и тестировать взаимосвязи между переменными в Excel и использовать его для статистики и анализа. Описан перенос данных из Excel в R, язык программирования с открытым исходным кодом, специально разработанный для выполнения статистического анализа. Отдельный раздел посвящен переносу данных из Excel в Python и выполнению полного анализа данных средствами этого языка. В результате читатель научится выполнять разведочный анализ данных (Exploratory Data Analysis, EDA) и проверку гипотез с использованием языков программирования Python и R. Для аналитиков данных.
Предисловие
Цель обучения
Предварительные условия
Технические требования
Требования к предварительной подготовке
Как я пришел к аналитике
«Excel — плохо, программирование — хорошо»
Преимущества Excel при обучении аналитике
Обзор книги
Упражнения в конце глав
Эта книга — не список готовых решений
Без паники!
Условные обозначения
Использование примеров кода
Контакты
Благодарности
Основы аналитики в Excel
Основы разведочного анализа данных
Что такое разведочный анализ данных?
Наблюдения
Переменные
Категориальные переменные
Количественные переменные
Закрепление материала: классификация переменных
Резюме: типы переменных
Исследование переменных в Excel
Исследование категориальных переменных
Исследование количественных переменных
Заключение
Упражнения
Понятие вероятности
Вероятность и случайность
Вероятность и выборочное пространство
Вероятность и эксперименты
Безусловная и условная вероятность
Распределение вероятностей
Дискретное распределение вероятностей
Непрерывное распределение вероятностей
Заключение
Упражнения
Основы инференциальной статистики
Базовые понятия статистического вывода
Сбор данных для репрезентативной выборки
Формулирование гипотез
Разработка плана анализа
Анализ данных
Принятие решения
Это ваш мир… данные только живут в нем
Заключение
Упражнения
Корреляция и регрессия
«Корреляция не подразумевает причинно-следственную связь»
Понятие корреляции
От корреляции к регрессии
Линейная регрессия в Excel
Переосмысление результатов: ложные зависимости
Заключение
Переход к программированию
Упражнения
Стек анализа данных
Статистика, аналитика и наука о данных
Статистика
Аналитика данных
Бизнес-аналитика
Наука о данных
Машинное обучение
Различия без взаимоисключения
Значение стека анализа данных
Электронные таблицы
VBA
Современный Excel
Базы данных
Платформы бизнес-аналитики (BI)
Языки программирования для анализа данных
Заключение
Что будет дальше
Упражнения
От Excel к R
Первые шаги в R для пользователей Excel
Загрузка R
Начало работы с RStudio
Пакеты в R
Обновление R, RStudio и пакетов R
Заключение
Упражнения
Структуры данных в R
Векторы
Индексирование и подмножества векторов
От таблиц Excel к кадрам данных R
Импорт данных в R
Исследование кадра данных
Индексирование и подмножества кадров данных
Запись кадров данных
Заключение
Упражнения
Обработка и визуализация данных в R
Обработка данных с помощью пакета dplyr
Постолбцовые операции
Построчные операции
Агрегирование и объединение данных
dplyr и оператор pipe (%>%)
Преобразование данных с помощью tidyr
Визуализация данных с помощью ggplot2
Заключение
Упражнения
Кульминация: R для анализа данных
Разведочный анализ данных
Проверка гипотез
t-тест для независимых выборок
Линейная регрессия
Разделение и проверка данных для обучения и тестирования
Заключение
Упражнения
От Excel к Python
Первые шаги в Python для пользователей Excel
Загрузка Python
Начало работы с Jupyter
Модули в Python
Обновление Python, Anaconda и пакетов Python
Заключение
Упражнения
Структуры данных в Python
Массивы NumPy
Индексирование и подмножества массивов NumPy
Кадры данных Pandas
Импорт данных в Python
Исследование кадра данных
Индексирование и подмножества кадров данных
Запись кадров данных
Заключение
Упражнения
Обработка и визуализация данных в Python
Постолбцовые операции
Построчные операции
Агрегирование и объединение данных
Преобразование данных
Визуализация данных
Заключение
Упражнения
Кульминация: Python для анализа данных
Разведочный анализ данных
Проверка гипотез
t-тест для независимых выборок
Линейная регрессия
Разделение и проверка данных для обучения и тестирования
Заключение
Упражнения
Заключение и дальнейшие шаги
Дополнительные элементы стека анализа данных
План исследований и бизнес-эксперименты
Дополнительные статистические методы
Наука о данных и машинное обучение
Контроль версий
Этика
Двигайтесь вперед и выбирайте то, что нравится
Напутствие
Предметный указатель
Об авторе
Об изображении на обложке
  • Чтобы скачать этот файл зарегистрируйтесь и/или войдите на сайт используя форму сверху.
  • Регистрация