AI ассистент в реальном времени

Jetske · 11.07.2025

Есть ли готовые реальные решения, либо может идеи как закодить правильно? Что бы например во время звонка (не зависимо где), или считывая прямо с экрана все что происходит выводились ответы\рассуждения.

chemodan · 11.07.2025

Тоже интересно

ExodussAB · 11.07.2025

Jetske сказал(а):

Есть ли готовые реальные решения, либо может идеи как закодить правильно? Что бы например во время звонка (не зависимо где), или считывая прямо с экрана все что происходит выводились ответы\рассуждения.

С экрана? Хз не слыхал о таком)

Dread Pirate Roberts · 11.07.2025

готового решения не видел, но теоретически такое накодить реально - отправлять "мультимодальным" моделям типа Gemma3 куски экрана и просить решить задачу с картинки.
получать данные из звонка тоже реально - Whisper https://github.com/openai/whisper очень быстрая модель для распознавания голоса, на мощном железе будет работать в реальном времени.

Dread Pirate Roberts · 12.07.2025

Jetske сказал(а):

Есть ли готовые реальные решения, либо может идеи как закодить правильно? Что бы например во время звонка (не зависимо где), или считывая прямо с экрана все что происходит выводились ответы\рассуждения.

мб оно: https://github.com/Roy3838/Observer

polishcool · 12.07.2025

с видеопотока либо с голоса? То можно в любой автоматизации от notion / n8n / make добавить вход языка и транскрипция сразу разговора вывод текста - передачи задачи и уже отрисовка. Зачем думать что-то сложнее?)

AI ассистент в реальном времени

Jetske

floppy-диск

chemodan

HDD-drive

ExodussAB

floppy-диск

Dread Pirate Roberts

Премиум

Dread Pirate Roberts

Премиум

polishcool

(L3) cache