Классификация и теория вероятностей
От: Gattaka Россия  
Дата: 17.12.16 15:49
Оценка:
Чтобы долго не рассказывать попробую выдумать задачу и адаптировать для нее. Предположим я прогнозирую список из 5 книг, которые купит пользователь с наибольшей вероятностью. Всего книг 24 возможных. У меня есть модель которая по фичам пользователя дает прогноз, она неплохо работает, но не учитывает изменения популярности книг со временем. А она значительна.
Предположим я обучался на 06 месяце 2015 года и мне надо сделать прогноз для 06 месяца 2016 года. Для некоторого пользователя получен прогноз:

[ 0.00273501 0.00273501 0.21609817 0.00411186 0.00925567 0.1917159
0.04742743 0.00293886 0.00331788 0.01592568 0.00443959 0.00344877
0.04274225 0.01281825 0.00274041 0.01408142 0.00274985 0.12125014
0.01134686 0.00730866 0.00296034 0.10991038 0.04232292 0.12561873]

Номер позиции в массиве это и есть книга. Далее он сортируется и берется 5 с наибольшими вероятностями. Но не суть.
В 15 году было куплино следующее количество книг

[ 1 0 3878 5 2347 40
531 226 131 0 0 46
2709 61 3 22 7 279
4248 183 7 5488 5513 10163]

В 16 году это количество изменилось

[ 0 0 6731 9 1872 8
211 216 152 290 33 956
1205 245 4 19 8 2933
4684 152 3 5082 8147 9031]

И я хотел бы сделать коррекцию прогноза на величину изменения популярности. Например, третья книга почти в два раза выросла по популярности. Казалось бы нужно разделить количество в 16 году на 15 год и умножить на вероятности прогноза. Но так делать нельзя. Т.к. для 6-й книги получится неоправданно большой (40/8) коэффициент. Т.е. нужно еще и общее число как-то учитывать. Вопрос как это делают?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.