Каждый день пользователи совершают миллионы действий в Интернете. Проекту FACETz DMP необходимо структурировать эти данные и проводить сегментацию для выявления предпочтений пользователей. Расскажем, как мы, используя Kafka и HBase:
- сегментируем 600 миллионов пользователей после перехода с MapReduce на Realtime и как мы это сделали;
- обрабатываем 5 миллиардов событий каждый сутки;
- храним статистику по количеству уникальных пользователей в сегменте при потоковой обработке;
- отслеживаем влияние изменений параметров сегментации.
Скачать презентацию