Lambdo предназначен для анализа данных путем определения новых признаков:
https://github.com/asavinov/lambdo
Этот проект может быть интересен тем, кто интересуется машинным обучением и анализом данных.
Особенности подхода:
Объединяются понятия модель машинного обучения и модель (определение) нового признака
Одно и то же описание (workflow) используется как для тренинга так и для предсказания, что гарантирует использование одинаковых признаков на обеих стадиях
Используется колончато-ориентированный подход, когда модель признака или модель обучения это определение новой колонки. Другой проект на этом же принципе: https://github.com/asavinov/bistro
Анализ опирается на пользовательские функции на Питоне
Проект нацелен в основном на анализ временных рядов, где признаки извлекаются из истории
Написание скриптов на Lambdo позиционируется между интерактивными средами как KNIME и языками программирования как Питон
Проект (описание анализа) выглядит как набор определений таблиц, каждая из которых включает определения своих колонок. Для определения таблицы надо задать функцию, которая будет заполнять ее записями. Для определения колонки надо задать функцию, которая будет вычислять ее значения по входным значениям. Структура проекта на JSON выглядит примерно так:
{
"tables": [
"table": { "function": "my_table_func_1", "columns": [...] }
"table": {
"function": "my_table_func_2",
"columns": {
"column": { "function": "my_column_func_1", ... }
"column": { "function": "my_column_func_2", ... }
}
"table": { "function": "my_table_func_3", "columns": [...] }
]
}
Больше примеров можно найти здесь:
https://github.com/asavinov/lambdo/tree/master/examples