GithubHelp home page GithubHelp logo

test's Introduction

test

my test

4_test.ipynb

Проект: вариант 4

Задание

Вы аналитик в компании, которая разрабатывает приложение для обработки и оформления фотографий в формате Stories (например, для дальнейшего экспорта в Instagram Stories). Был проведен A/B тест: тестовой группе предлагалась новая модель оплаты коллекций шаблонов, контрольной – старая механика. Ваша основная задача: проанализировать итоги эксперимента и решить, нужно ли выкатывать новую модель на остальных пользователей.

В ходе отчета обоснуйте выбор метрик, на которые вы обращаете внимание. Если различия есть, то объясните, с чем они могут быть связаны и являются ли значимыми.

Результаты

В ходе исследования результатов A/B тестирования было получено:

  1. Bootstrap тест по среднему для пользователей дает p-value > 0.05, что не позволяет отклонить нулевую гипотезу и считать статистически незначимыми различия в двух выборках.
  2. Bootstrap тест по среднему для клиентов дает p-value < 0.05, что позволяет отклонить нулевую гипотезу и считать статистически значимыми различия в двух выборках.
  3. Конверсия в тестовой и контрольной группе - одинаковая
  4. ARPU увеличилось на 17.98% в тестовой по сравнению с контрольной.
  5. ARPPU увеличились на 28.5% в тестовой по сравнению с контрольной.

Выводы:

Полученнные результаты свидетельствуют о том, что

  1. Новая модель оплаты увеличивает средний доход, ARPU и ARPPU.
  2. При этом конверсия из пользователя в клиента не изменилась, следовательно новых клиентов не появилось.

Учитывая тот факт, что изменения рассматриваемые в A/B тесте были связаны с новой моделью оплаты коллекций шаблонов, то полученные результаты хорошо согласуются. Клиенты - те кто готов платить и приходят в приложение именно с этой целью и именно их средний доход увеличился. Было показано, что данное изменение является статистически значимым. Пользователи же в принципе не все и не всегда доходят до формы оплаты, изменение которой рассматривается. Поэтому маловероятно, что оно могло повлиять на конверсию пользователя в клиента, а как следствие и на средний доход от пользователей.

Новую модель оплаты рекомендуется выкатить на остальных пользователей.

FP2_new (2).ipynb

Проект: вариант 2 Вы – единственный аналитик в компании, на которого легла ответственность за поиск инсайтов в данных продуктовых магазинов вашей компании. На повестке 3 задачи:

Задание 1

В файле test1_completed.csv содержится информация о покупках людей

id – означает покупку (в одну покупку входят все товары, купленные пользователем во время 1 похода в магазин)

Товар – наименование товара

Количество – число единиц купленного товара

Воспользуйтесь этими данными и выясните, какие пары товаров пользователи чаще всего покупают вместе. По сути, вам необходимо найти паттерны покупок, что позволит оптимизировать размещение продуктов в магазине, для удобства пользователей и увеличения выручки.

1_Товар – наименование первого товара

2_Товар – наименование второго товара

Встречаемость – число раз, когда такая пара была встречена Другими словами: 2 раза люди покупали одновременно чай и арбуз, 1 раз одновременно покупали арбуз и сгущёнку и 1 раз одновременно были куплены чай со сгущёнкой.

Напишите код на python для получения нужной таблицы и укажите 5 наиболее распространённых паттернов.

Результат

Топ 5 самых покупаемых товаров вместе выгружается в таблицу эксель top5_pair.xlsx

Задание 2¶

К вам поступила информация о числе заказов за прошедшие 3 месяца с разрешением по неделям. Постройте (если это возможно) прогноз продаж на следующие 3 месяца, с учётом того, что в неделю с 2020-02-02 по 2020-02-09 была проведена массивная акция, повысившая число заказов на 7% Данные в test2_completed.csv

Прогонозирование было сделано при помощи Prophet

Результаты и выводы.

Прогнозирование временного ряда было выполнено, как математический эксперимет, безотносительно реальности процессов. Полученный линейный тренд хорошо согласуется с трендом в изначальных данных. Cредняя абсолютная ошибка в процентах составляет 6.75 % что означает, что модель может ошибаться в среднем на 6,7%. Но есть несколько моментов, которые мешают сказать, что полученный прогноз - хороший.

Данных на которых модель учится - мало, что сказывается на качестве модели. Из-за этого сложно учесть сезонность помесячную, и невозможно поквартальную и годовую. Период, на который требуется предсказать количество заказов, равен периоду, на котором основывается модель, что тоже не очень хорошо. Из условия задания предполагается, что речь идет о каком-то продукте, предоставлюящим услуги или товары, и в том и в другом случае количество заказов не может быть бесконечным, в виду ограниченности количества пользователей и насыщаемости рынка. В таком случае следует использовать тренд с насыщением(логистическую регрессию), но никакой информации о естественной емкости системы у нас нет.

Задание 3

SQL-запрос для создания таблицы с указанными полями.

Test_task1-d.ipynb

Рассчет метрики LTV используя когортный анализ для приложения - мобильная утилита для сканирования документов. Прогноз LTV. Расчет ROMI.

test's People

Contributors

kseniiaezd avatar

Watchers

 avatar

Forkers

olgars8888

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.