

Рынок AI-инструментов растёт как на дрожжах — за 2024 год инвестиции в генеративные нейросети перевалили за $29 млрд, а запросов к API DALL·E и Midjourney стало раз в пять больше. Telegram боты давно стали простым и само собой разумеющимся способом автоматизации рутины: по данным Telegram Analytics, больше 68% малого бизнеса в СНГ юзают их для обслуживания клиентов, продаж и создания контента. А знаете, что обалденного в этом? Многим до сих пор почему-то кажется, что создать бота, который умеет из текста творить картинки — это какая-то космическая задача. А на самом деле современные no-code платформы позволяют собрать такого помощника за 15–20 минут. Без единой строчки кода.
«Мы замутили для своих задач image generation бота — дизайнеры экономят до 15 часов в неделю на быстрых черновиках. Всю систему собирали в ASCN.AI за каких-то два вечера: подключили DALL·E API через HTTP Request, настроили Telegram триггер, добавили AI Agent, который у нас с запросами на русском языке работает. Бот, понимает смысл запроса, разумно предлагает разные варианты по улучшению промпта и сразу же в чат шлет картинки. Без единственной строчки кода — только визуальный конструктор. Теперь сами маркетологи под свои новые задачи правят себе логику.»
В этой статье по полочкам распутаем, как выбрать нейросеть, получить API-токен, подстроить интеграцию с Телеграмом и через AI-агентов автоматизировать генерацию. Узнаете, как умудриться избежать банальных косяков, как не переплачивать за подписки и как масштабировать бота под любые нагрузки.
Telegram бот — это автоматизированный аккаунт, управляемый через Telegram Bot API. Вообразите себе виртуального ассистента, способного реагировать на команды, обрабатывать просьбы, выдавать отчеты, а также отправлять сообщения, документы и картинки. В отличие от обычного чата, этот помощник способен реализовывать заранее написанные программы либо сценарии — без участия человека.
Вот вам реальная история из жизни: маркетинговое агентство, которое воспользовалось таким ботом, уменьшило время согласования и подготовки обложек для соцсетей почти на 80%. Теперь дизайнеры занимаются сложными проектами, а быстрая плашечка визуала создаётся в один миг.
Просто. Эффективно.

Основой генерации картинок с помощью ИИ являются диффузионные модели и трансформеры, которые натасканы на огромных наборах пар «текст–изображение». Тот самый текстовый запрос — промпт — отправили вы, получив на его основе уникальное изображение. Быстро.
Как это работает: промпт проходит анализ, ИИ выбирает основные параметры, постепенно собирая изображение, увеличивая детализацию.
Но есть нюансы: текст на картинках часто искажается, а руки и лица могут получаться... ну, странными. Качество зависит в значительной степени от деталей, вложенных в ваш промпт.
Хотя по тому же Stanford AI Index 2024 точность генерации по сложным запросам увеличилась на 34% благодаря новым архитектурам и увеличенным датасетам — артефактов стало меньше.
Самые известные фирмы, работающие в этой области, — это DALL·E, Stable Diffusion, Midjourney и другие. Ощущаются строго определённые качества и недостатки, черты достоинства и определяющие стоимость факторы. Из-за всего этого живёт слава среди людей — все обитатели сети стремятся ответить на вопрос: «Сколько стоит хорошее искусство?»
| API | Достоинства | Недостатки | Стоимость |
|---|---|---|---|
| DALL·E | Фотореализм, высокое качество, работа со сложными запросами, встроенный фильтр контента | Лимит 50 запросов в минуту, зависимость от серверов OpenAI, цензура контента | Первые 50 кредитов бесплатно (50 картинок 1024×1024), далее — $0.02 за картинку |
| Stable Diffusion | Открытый код, гибкая настройка, возможность локальной установки на любом железе | Нужен GPU от 8 ГБ, нет официального пособия по установке, базовая модерация контента | Бесплатно при локальной установке; API (Replicate) — от $0.0023 за картинку 512×512 |
| Midjourney | Арт-стили, многообразие и простота через Discord | Нет открытого API, подписка платная, есть очередь на генерацию | $10–60 в месяц с лимитами по числу картинок |
| Leonardo.AI | Фокус на игровых ассетах, облачный редактор, множество стилей | Бесплатный тариф с ограничениями, стили менее разнообразны чем у конкурентов | Бесплатно с условиями; Pro — $12 в месяц |
| Adobe Firefly | Безопасно для коммерческого использования, интеграция с Creative Cloud | Стили менее разнообразны, требуется подписка | От $54.99/мес с ограниченным числом генераций |
Для быстрого запуска коммерческого проекта подойдёт DALL·E. Для экспериментов с полным контролем — Stable Diffusion. Художественные задачи — Midjourney.
API — это интерфейс, по которому ваше приложение взаимодействует с нейросетью, шлёт ей свои запросы и получает обратно URL-адрес с изображением.
Наш пример — запрос к OpenAI DALL·E:
POST https://api.openai.com/v1/images/generations
Headers:
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
Body:
{
"prompt": "A futuristic city at sunset, cyberpunk style",
"n": 1,
"size": "1024x1024"
}
В ответ возвращается JSON с адресом сгенерированной картинки. Конечно, настраиваются различные параметры — количество генерируемых вариантов, разрешение, системное описание.
Для Stable Diffusion зачастую используют чужие API, либо запускают модель локально с REST API — а это требует навыков в DevOps.
Надо понимать: у каждого API свои лимиты и тарифы на использование.

Регистрация сие требует 2 минуты времени и не нужно хоть как-то уметь программировать:
/newbot.Взаимодействие с API генерации изображений строится в три слоя:
Если при программировании вы хотите обойтись без программирования, современные no-code платформы (например, ASCN.AI, n8n, Zapier) дают вам возможность визуально построить весь сценарий. Если же вы хотите реализовать что-то более сложное и масштабируемое, будут использоваться реализации на Python (python-telegram-bot), Node.js или Go.
/start, смотрите — бот отвечает./start и /help обрабатывались веселым разрядом, а текстовые сообщения натурально попали на генерацию.Да сложно? Да нет.
import os
from telegram import Update
from telegram.ext import Updater, CommandHandler, MessageHandler, Filters, CallbackContext
import openai
TELEGRAM_TOKEN = os.getenv("TELEGRAM_BOT_TOKEN")
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
openai.api_key = OPENAI_API_KEY
def start(update: Update, context: CallbackContext):
update.message.reply_text("Привет! Напиши как можно более подробно описание, я сгенерирую изображение.")
def generate_image(update: Update, context: CallbackContext):
prompt = update.message.text
update.message.reply_text("Генерирую изображение, подожди-ка...")
try:
response = openai.Image.create(prompt=prompt, n=1, size="1024x1024")
image_url = response['data'][0]['url']
update.message.reply_photo(photo=image_url, caption=f"Промпт: {prompt}")
except Exception as e:
update.message.reply_text(f"Генерация с ошибкой: {e}")
def main():
updater = Updater(TELEGRAM_TOKEN, use_context=True)
dp = updater.dispatcher
dp.add_handler(CommandHandler("start", start))
dp.add_handler(MessageHandler(Filters.text & ~Filters.command, generate_image))
updater.start_polling()
updater.idle()
if __name__ == '__main__':
main()
Каждый API имеет ограничения и тарифы. Например, OpenAI DALL·E:
Если, теряя бдительность, вы превысите его предел, вы получите ошибочку 429 (Too Many Requests). Стейбл Диффьюжн — API стоит от $0.0023 за картинку 512×512, а у Миджорни нужно подписаться и подождать в ожидании ответа.
А чтобы сократить расходы, полезно ещё:
Дисклеймер: информация общая, не является профессиональной консультацией.
Telegram и в этой области дисциплинарен и предан своему обещанию. Спам, фейки и вредоносный контент — табу. Обязательна поддержка базовых команд — /start, /help, хранение политики конфиденциальности и быстрая реакция на жалобы. При блокировках бота обращайтесь в службу поддержки @BotSupport.
Для защиты от злодеев и хипстеров используйте:
Да, no-code платформы (ASCN.AI, n8n, Zapier) делают возможным создание бота абсолютно визуально. Для большинства задач бизнеса — этого более чем достаточно.
Собственный бот — это полный контроль, экономия на подписках и возможность добавить уникальный функционал.
Задействуйте нарядные подсказки с конкретными деталями стиля и освещения, разрешения. AI-Agent может перевести короткие слоганы в развёрнутые — это улучшает качество. Оптимально, если разрешение задаётся равным 1024×1024 пикселей, с несколькими вариантами генерации и подбором. Этап post-processing тоже возможен — AI-апскейлеры, inpainting, color-correction значительно поднимают уровень конечного результата.