Недавно, буквально сутки назад, гугл открыла для всех доступ к Gemini Pro 1.5
об этом есть статья: https://vc.ru/future/1087796-tri-ch...hnoy-neyroseti-nashego-vremeni-gemini-1-5-pro
Но Gemini 1.5 Pro не останавливается на тексте. Модель еще может обрабатывать:
Сделал небольшой проект шаблон чата с ним при помощи его API: https://github.com/ElonMusk2002/gemini-pro-chat-template
Можно общаться с двумя моделями, одна просто текст, другая текст + анализ изображения. Накидал за часик, для демонстрации. Для работы требуется ключ, его берем отсюда:
об этом есть статья: https://vc.ru/future/1087796-tri-ch...hnoy-neyroseti-nashego-vremeni-gemini-1-5-pro
Почему такой ажиотаж?
Gemini 1.5 Pro - это первая модель, которая смогла перешагнуть через порог в один миллион токенов за один вопрос, что составляет примерно 700 000 слов (для сравнения два тома "Войны и мир" содержат 616 668 слов и где-то ~1300 страниц)Но Gemini 1.5 Pro не останавливается на тексте. Модель еще может обрабатывать:
- До 1 часа видео, правда без аудиодорожки. Нейросеть может считывать события, которые происходят и текст в кадре (к примеру со слайдов).
- До 30 000 строчек кода, причем можно загрузить сразу весь проект из кучи файлов - Gemini сама подскажет какие новые функции можно сделать и напишет для них код.
- Фотографии - модель понимает весь контекст и объекты.
Беспрецедентный прорыв
Gemini 1.5 Pro не просто обогнала GPT-4 в 8,2 раза по размеру контекстного окна. Она действительно понимает информацию на всем его протяжении. При тестировании Gemini не заметила нужный фрагмент текста только в 3 из 1125 запросов.
Инструкция
- Открываем браузер Google Chrome и включаем, либо свой VPN, либо можно устанавливаем бесплатное VPN расширение - Browsec VPN.
- Выбираем страну - Сингапур или США. Они есть в официальном списке стран в которых доступна Gemini. Ночью работало и с Нидерландами, но сейчас уже такой вариант не проходит.
- Переходим на сайт aistudio.google.com/app, залогиниваемся через гугл почту и используем Gemini 1.5 Pro для своих грандиозных задач, загружая файлы и целые папки, либо просто используя общение с нейросетью.
Сделал небольшой проект шаблон чата с ним при помощи его API: https://github.com/ElonMusk2002/gemini-pro-chat-template
Можно общаться с двумя моделями, одна просто текст, другая текст + анализ изображения. Накидал за часик, для демонстрации. Для работы требуется ключ, его берем отсюда:
Код:
https://aistudio.google.com/app/apikey