Reasoning models — korshunov.ai

Reasoning models Страница 1 / 35

Язык формирует историческую кредитность в больших языковых моделях

Исследование 11 больших языковых моделей по 21 спорному изобретению показывает, что язык запроса систематически влияет на того, кого признают изобретателем. Потенциальные заявители с более низким статусом чаще появляются при формулировке вопросов на их родном языке, в то время как доминирующие англоязычные фигуры остаются стабильными. Результаты указывают на то, что язык действует как переключатель, активирующий различные национальные версии истории, что свидетельствует о том, что большие языковые модели функционируют как системы культурной памяти.

Язык формирует историческую кредитность в больших языковых моделях

DART: Обучение-бесплатное перенаправление для адаптивных бюджетов мышления

Контагиозное распространение памяти: распространение предвзятости в памяти агентов

Анализ задачоспецифичности врожденной самокоррекции

CFPO: Counterfactual Policy Optimization для многомодального мышления

Расширение, основанное на оценке, для генерации экспертной оценки

IMLogic Benchmark и RootMem Framework для неявного логического воспроизведения памяти

Трансформаторы на основе энергии предсказывают сложность чтения

Самостигма не является однородной: LLMs нуждаются в поддержке, учитывающей персонаж

ReasoningLens: иерархическая визуализация для больших моделей рассуждений

UnBias-Plus: Выявление, объяснение и переписывание предвзятости

TriggerBench: оценка перспективной памяти в больших языковых моделях

SelfCompact: Самодвижущийся сжатие контекста для языковых моделей

VeriEvol: масштабирование многомодальных математических рассуждений с верифицированной эволюцией

LLMs не способны надежно отчетливо отражать влияние атак на предварительные заполнения

Случайный YaRN улучшает обобщение по длине для рассуждений с длинными контекстами

Симметричные Q-сорты оценивают структурную согласованность с моральными ценностями в LLMs

На самом деле ли многозначные модели улучшаются? Изоляция истинного межязыкового переноса

Могут ли LLMs управлять читаемостью на арабском?

Оценка больших языковых моделей для преобразования графем в звуки на японском языке