Сообщения

Очерки, технические статьи и мысли о построении суверенных систем.

Память агента разрывается на 500 тысячах токенов, а не на 10 миллионах.

Память агента разрывается на 500 тысячах токенов, а не на 10 миллионах.

BEAM тестирует извлечение 10 миллионов токенов. Государственная целостность ухудшается при 500К. Два режима отказа активируются в разных масштабах, и никто не оценивает предыдущий.

6 минута чтенияЭссе
Ни один тест памяти AI не тестирует то, что на самом деле ломается

Ни один тест памяти AI не тестирует то, что на самом деле ломается

Метрики, которые способствуют внедрению памяти ИИ, почти все являются метриками поиска. Нужен хороший поиск. Нет широко используемых тестов производительности, что происходит с сохраненными данными после того, как агенты записывают в них данные.

12 минута чтенияЭссе

Персонализированное исследование клиентов через агентов, а не через человеческие звонки

Восемнадцать оценщиков продуктов, созданных людьми, выполнили одну и ту же процедуру оценки с помощью своих инструментов искусственного интеллекта. Рецензии были резче любого звонка. Эта обратная связь изменила позиционирование продукта, а затем и процесс его приобретения. Домашняя страница теперь просит агентов оценить, а не людей зарегистрироваться.

13 минута чтенияЭссе
Одиннадцать релизов за пять недель

Одиннадцать релизов за пять недель

Я выпустил одиннадцать релизов Neotoma в первые пять недель после выпуска для разработчиков. CLI теперь работает на других машинах, разблокируя подключение. Сервер MCP достаточно стабилен для ежедневного использования агента. База данных может пережить ошибки оператора. Вот что изменилось и почему.

9 минута чтенияtechnical
Общение напрямую с агентами как с целевыми клиентами

Общение напрямую с агентами как с целевыми клиентами

Около восемнадцати из двадцати шести человек, с которыми мне удалось связаться, выполнили одну и ту же процедуру оценки с помощью своих инструментов искусственного интеллекта. Рецензии были резче любого звонка. Эта обратная связь изменила позиционирование продукта, а затем и процесс его приобретения. Домашняя страница теперь просит агентов оценить, а не людей зарегистрироваться.

13 минута чтенияЭссе
Чего требует от вас технология

Чего требует от вас технология

Дебаты по поводу ИИ отражают вопрос, который Просвещение так и не решило. Руссо сказал, что инструменты нас развращают. Кондорсе сказал, что они нас совершенствуют. Ницше сказал, что оба упускают суть. Технология — это проверка характера, и единственный честный ответ — кем вы станете в ходе столкновения.

Как я потерял и восстановил 6000 воспоминаний

Как я потерял и восстановил 6000 воспоминаний

Я случайно перезаписал свою производственную базу данных Neotoma и уменьшил количество наблюдений с 6174 до 84. Я получил почти все данные обратно. Восстановление сработало, поскольку архитектура Neotoma хранит наблюдения в виде журнала, доступного только для добавления, и пересчитывает состояние объекта на основе этого журнала.

6 минута чтенияЭссе
Преследование повествований в тупик

Преследование повествований в тупик

Повествование о FOMO последовало за мной от криптовалюты до искусственного интеллекта. В Leather ажиотаж вокруг Ordinals ощущался как реальный спрос. В Neotoma каждый твит, связанный с воспоминаниями, вызывает одну и ту же проблему. Я жил в обоих случаях, когда повествование может разрушить ваш продукт. Заимствованный сигнал имеет ограничение по сроку действия.

12 минута чтенияЭссе
Скептицизм в отношении ИИ на самом деле связан с верой в людей

Скептицизм в отношении ИИ на самом деле связан с верой в людей

Люди, которые используют ИИ, сталкиваются с его проблемами более непосредственно, чем кто-либо другой. Но они также больше всего верят, что люди могут работать через них. Настоящий скептицизм не связан с машинами.

Обновление сайта Neotoma с учетом отзывов разработчиков о выпуске

Обновление сайта Neotoma с учетом отзывов разработчиков о выпуске

Я переработал сайт Neotoma. Старая одностраничная стена текста теперь представляет собой визуальную презентацию, подкрепленную документацией, руководствами по интеграции для конкретных инструментов и глубокими погружениями в архитектуру, основанными на том, что говорили тестировщики и где они застряли во время выпуска для разработчиков.

10 минута чтенияЭссе