Купил сумку, купил руку
ca
At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS
#ERRLOOM

Обновление статуса по Errloom, моей библиотеке / инструментарию для обучения с подкреплением. Все идет довольно хорошо, и мы вскоре начнем обучение некоторым концепциям суперинтеллекта. На изображении ниже показан главный экран Errloom.
Одна команда принимает входной скрипт для обучения и разворачивает его на облачных вычислениях по вашему выбору: отображает список предложений в интерактивном TUI-списке для выбора, подключается через SSH, настраивает всю среду, клонирует errloom, запускает сервер vllm и запускает errloom для обучения — локальный errloom выступает в роли менеджера и панели управления, открывает WanDB в вашем браузере, когда начинается обучение, периодически загружает логи и контрольные точки и отображает трассировку удаленного процесса. Никаких ненужных jupyter или других избыточных шагов. Напишите среду для запросов своей мечты, выполните одну команду и оставьте компьютер на обед.
Сообщение помощника демонстрирует, как я настроил прогрессивный рабочий процесс разработки. Поскольку я работаю с нулевым бюджетом и ресурсами, мне нужно, чтобы каждая копейка имела значение. Забудьте о аренде облачных вычислений только для разработки этой библиотеки. Нам нужно, чтобы она проходила через большую часть программной цепи на мощной домашней установке.
Чтобы достичь этого, я разработал ряд команд и флагов функций для прогрессивного тестирования, строя весь конвейер кирпич за кирпичом, пока у вас не появится полная уверенность и осведомленность о том, что GRPO и обратное распространение получат именно те контекстные окна и маски токенов, которые вы хотите.

10,53 тыс.
1
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.