Контекстное окно в 1M токенов: что это меняет на практике
Gemini 1.5, Claude и GPT-4 давно перешагнули отметку в 100K токенов. Но что реально меняется в разработке, когда в контекст влезает целая кодовая база или книга?
Читать →Статьи, новости компании и мысли о технологиях.
Gemini 1.5, Claude и GPT-4 давно перешагнули отметку в 100K токенов. Но что реально меняется в разработке, когда в контекст влезает целая кодовая база или книга?
Читать →Один большой промпт против команды специализированных агентов — разбираем архитектуру, паттерны оркестрации и реальный опыт внедрения в продуктах.
Читать →GGUF, AWQ, GPTQ — как сжать 70B модель до размеров, которые запустятся на бюджетном VPS, и что при этом теряется в качестве.
Читать →Telegram запустил внутреннюю валюту — Stars. Разбираем как это меняет монетизацию ботов, какие комиссии, и стоит ли переходить с YooKassa.
Читать →GitHub Copilot, Cursor, Claude — что реально ускоряет работу, где AI мешает думать, и как мы выстроили процесс чтобы не деградировать как разработчики.
Читать →Apple Neural Engine, Qualcomm NPU, WebAssembly — инференс всё активнее переезжает с сервера на клиент. Разбираем что это даёт и где предел.
Читать →GPT-4o, Gemini 1.5 и Claude понимают изображения, аудио и видео. Как мы используем это в реальных продуктах и где мультимодальность реально нужна.
Читать →App Store перенасыщен. Пользователи не хотят ставить ещё одно приложение. Telegram Mini Apps меняют правила — нулевой порог входа, моментальный доступ и нативный UX без установки.
Читать →Vosk для распознавания речи оффлайн, gTTS для синтеза — и GPT-4o как мозг, который оценивает произношение, грамматику и структуру ответа. Разбираем архитектуру Speaking-модуля AI Teacher.
Читать →Пользователь фотографирует результат анализа крови — через 10 секунд бот выдаёт структурированные маркеры с отклонениями. Как мы связали Google Vision и GPT-4 в один пайплайн.
Читать →Retrieval-Augmented Generation позволяет боту отвечать на основе реальных данных, а не фантазий модели. Рассказываем, как мы внедряем RAG в наши продукты и зачем это нужно.
Читать →Загружаешь своё фото, выбираешь вещь из каталога — нейросеть надевает её на тебя. Под капотом: сегментация через SAM, генерация через IDM-VTON, и много боли с качеством.
Читать →Мы выбрали Flutter для мобильной разработки. Единая кодовая база, нативная производительность, горячая перезагрузка — и Dart, который оказался приятнее, чем ожидали.
Читать →