BIS vs LLM: Банк международных расчетов против обучаемых языковых моделей

ktpm23 · 24.02.2024

В своем исследовании Фернандо Перес-Крус и Хюин Сон Шин из Банка международных расчетов (BIS) провели тестирование способности обучаемых языковых моделей (LLM) понимать вопросы, задаваемые ими. Они обнаружили, что несмотря на впечатляющие результаты, сомнения о том, "знают" ли LLM или "понимают" они, что говорят, все же остаются.

Исследователи отмечают, что LLM, как правило, просто повторяют текст, с которым они сталкивались во время обучения, не обладая настоящим пониманием. Это вызывает серьезные сомнения не только с философской точки зрения, но и в контексте возможных экономических последствий использования LLM.

Для проверки этой гипотезы, Перес-Крус и Шин создали логическую головоломку под названием "День рождения Шерил", которая позволила оценить способности LLM к решению сложных задач. Головоломка заключается в том, чтобы определить день рождения Шерил, зная информацию, переданную Альберту и Бернарду.

Важно отметить, что даже при таком простом задании LLM не смогли достичь значимого прогресса и объединить свои знания для решения задачи.

Это исследование поднимает важные вопросы о реальном понимании обучаемыми языковыми моделями и их возможностях. Оно призывает нас задуматься о применении таких моделей в различных областях, включая экономику и философию знаний.

Источник https://www.bis.org/publ/bisbull83.pdf

H0unT · 25.02.2024

ktpm23 сказал(а):

Оно призывает нас задуматься о применении таких моделей в различных областях, включая экономику и философию знаний.

Это вообще какой то прикол, когда говорят о ллм что то вроде:
"Оно заменит философов, программистов, переводчиков...."

Один вопрос - как?)

Для большинства гуманитарных профессий/отраслей фундаментально от человека требуется - наличие сознания, умение размышлять.

Нейросети и ллм - это программа(хоть и крутая, но тем не менее) - логически структурированная "инструкция" к действию.

До AGI нам еще ср@ть и ср@ть...

ktpm23 · 25.02.2024

H0unT сказал(а):

Это вообще какой то прикол, когда говорят о ллм что то вроде:

У некоторых людей действительно есть такие опасения, потому что они сами по себе склонны к тревожности и переживают из-за непредсказуемых событий в мире. Эта тема активно обсуждается в медиа, так как корпорации нуждаются в инвесторах и пытаются показать результат, поэтому пишут много и проводят различные эксперименты в этой отрасли.

Однако, стоит учесть, что все эти разработки появились еще в 40-50-х годах XX века, и только сейчас удалось достичь хоть какого-то результата и попробовать внедрить их в различные сферы. Причина кроется в чипах и вычислительных мощностях, где также есть свои ограничения.

BIS vs LLM: Банк международных расчетов против обучаемых языковых моделей

ktpm23

(L1) cache

H0unT

(L2) cache

ktpm23

(L1) cache