Информация об изменениях

Сообщение Re[5]: Автоматическое создание KB из EMAIL от 12.07.2025 23:35

Изменено 12.07.2025 23:38 bnk

Re[5]: Автоматическое создание KB из EMAIL
Здравствуйте, dmitry251, Вы писали:

bnk>>>Так я хочу чтобы он их сам просмотрел в ящике саппорта, выбрал что подходит по смыслу, и создал markdown файлы. Т.е. полностью делегировать эту задачу. Много хочу?


T>>ну надо выгрузить все письма в один или несколько файлов, загрузить их в чат, написать — выбери часто повторяющиеся вопросы, сгруппируй, создай такие-то странички.


D>А разве оно может обрабатывать хотя бы мегабайт за один запрос? меряет вроде словами, и если html-разметка то вообще труба. Я экспериментировал с переводом HTML-страниц целиком через ChatGPT Mini, и приходилось резать даже 200Кб файлы на куски.


Через API все можно, там 1М токенов влазит
https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-flash
А вообще файлы (PDF и прочее, типа моего случая с почтой) не так обрабатываются, они сначала индексируются.

Если ты про HTML файлы в проекте, их лучше в режиме "агента" обрабатывать а не фигачить в чат браузера конечно,
это ппц каменный век, агент их сам тогда как надо порежет или какие нужно изменить куски выберет.
Re[5]: Автоматическое создание KB из EMAIL
Здравствуйте, dmitry251, Вы писали:

bnk>>>Так я хочу чтобы он их сам просмотрел в ящике саппорта, выбрал что подходит по смыслу, и создал markdown файлы. Т.е. полностью делегировать эту задачу. Много хочу?


T>>ну надо выгрузить все письма в один или несколько файлов, загрузить их в чат, написать — выбери часто повторяющиеся вопросы, сгруппируй, создай такие-то странички.


D>А разве оно может обрабатывать хотя бы мегабайт за один запрос? меряет вроде словами, и если html-разметка то вообще труба. Я экспериментировал с переводом HTML-страниц целиком через ChatGPT Mini, и приходилось резать даже 200Кб файлы на куски.


Через API все можно, там 1М токенов влазит
https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-flash
А вообще файлы (PDF и прочее, типа моего случая с почтой) не так обрабатываются, они сначала индексируются.

Если ты про HTML файлы в проекте, их лучше в режиме "агента" обрабатывать а не фигачить в чат браузера конечно,
это ппц каменный век, агент их сам как надо порежет или какие нужно изменить куски выберет.