Метод позволяет значительно сократить объем памяти, необходимый для хранения исторических статистик оптимизатора, при этом сохраняя качество обучения.
языковые модели
-
-
Искусственный интеллектНаукаТехнологии
Разум в машине: российские ученые научили робота ориентироваться в многоэтажных зданиях и пользоваться лифтом
Автор Игорь ВоронцовАвтор Игорь ВоронцовНовый подход LaMDEN объединяет построение подробной трехмерной карты окружения и возможности больших языковых моделей для планирования сложных действий. Тем самым открываются пути к созданию автономных сервисных роботов, способных эффективно работать в сложной человеческой среде, от офисов и больниц до жилых комплексов.
-
Искусственный интеллектНаукаТехнологии
Цифровой иммунитет для искусственного разума: российские ученые научили нейросети писать безопасный код
Автор Игорь ВоронцовАвтор Игорь ВоронцовКоманда исследователей представила новый подход взаимодействия с ИИ-помощниками разработчика, направленный на снижение количества дефектов в коде. Ученые разработали систему, способную писать программы, самостоятельно находить и исправлять в них ошибки.
-
Искусственный интеллектНаукаТехнологии
Экзамен на выносливость для искусственного интеллекта: в России создан первый масштабный набор тестов для нейросетей на «понимание» длинных текстов
Автор Игорь ВоронцовАвтор Игорь ВоронцовLIBRA — первый в своем роде масштабный бенчмарк для оценки способности больших языковых моделей (LLM) работать с длинными текстами на русском языке. LIBRA единый, открытый и сложный полигон, на котором все желающие могут проверить свои модели в честном соревновании. В открытый доступ представлены сами задания, код для оценки и публичная таблица лидеров, что будет стимулировать дальнейшее развитие и совершенствование русскоязычных нейросетей.
-
Горизонты наукиИскусственный интеллектНаукаТехнологии
Создана первая карта потоков “мышления” искусственного интеллекта
Автор Игорь ВоронцовАвтор Игорь ВоронцовКоманда исследователей из Т-Технологий и МФТИ разработала метод, позволяющий построить детальную «карту» эволюции абстрактных понятий в глубине больших языковых моделей. Этот подход, основанный на «графах потоков признаков», не только открывает…
-
Горизонты наукиИскусственный интеллектМатематикаНаукаТехнологии
Ученые создали аналог МРТ для искусственного интеллекта
Автор Игорь ВоронцовАвтор Игорь ВоронцовКоманда исследователей из Т-Технологий, МФТИ и НИУ ВШЭ разработала новаторский метод, позволяющий впервые проследить «жизненный цикл» отдельных концепций внутри сложных нейронных сетей. Их подход, получивший название SAE Match, работает как…
-
Новости
В МФТИ презентовали инструмент для анализа встроенности больших языковых моделей в национальную культуру
Автор Варвара КравцоваАвтор Варвара КравцоваВ рамках мероприятия научная группа Центра междисциплинарных исследований МФТИ вместе с приглашенными экспертами в области культурологии и лингвистики представили инструмент для анализа встроенности больших языковых моделей в русскую культуру.
-
Искусственный интеллектНаука
Разработан метод оценки эффективности нейросетей в работе с длинными текстами
Автор Елизавета ПевнаяАвтор Елизавета ПевнаяОн будет представлен в Ванкувере на одной из крупнейших мировых ИИ-конференций.
-
Искусственный интеллектНаукаТехнологии
ChatGPT использовали для обучения нейросети
Автор Мария ГлушанинаАвтор Мария ГлушанинаНовый алгоритм показал хорошие результаты и позволит сократить расходы на обработку текстовых данных.
