ai2026/6/8 13:00:00

画像: Pixabay
レイヤーをスキップするか、ループするか?LLMにおけるプログラム・オブ・レイヤーの学習
ニュース概要
大規模言語モデル(LLM)は従来、固定の深さと順序で全レイヤーを非反復的に実行して推論を行う。本研究は、訓練不要で柔軟な動的プログラム・オブ・レイヤー(PoLar)が広く存在することを明らかにする。事前学習されたレイヤーをモジュールとしてパッキングしてスキップまたはループさせ、各入力に対してカスタマイズされたプログラムを形成できる。ほとんどの入力では、大幅に短いプログラム実行で同等以上の精度を達成でき、元のLLMの誤った予測も、より少ないレイヤーを持つ別のプログラムで修正できる。これらの観察は、推論が標準的なフォワードパスを超えた複数の有効な潜在計算を認めることを示唆している。実践的にPoLarを効率的に実現するため、軽量なPoLar予測ネットワークを提案する。このネットワークは各入力に対して事前学習されたレイヤーを動的にスキップまたは繰り返す実行プログラムの生成を学習する。数学的推論ベンチマークでの実験により、PoLarは標準推論および従来の動的深さ手法と比べて一貫して精度を改善し、多くの場合より少ないレイヤーを実行することを示す。
ニュースタイムライン
2026年5月29日
株式会社QueeenB、AI for Science時代の研究構想を実験自動化計画に落とし込む「AI for Science ラボ自動化相談プログラム」を開始PR TIMES
2026年6月5日
日立、Anthropicが推進するAIを活用したセキュリティプログラム「Project Glasswing」に参画(クラウド Watch)Yahoo!ニュース IT
2026年6月5日
日立、Anthropicが推進するAIを活用したセキュリティプログラム「Project Glasswing」に参画クラウド Watch
2026年6月8日
OpenAI経済研究交流プログラムを発表OpenAI
🤖
記事AI質問チャット
PREMIUMこの記事についてAIが質問に答えます。背景・要約・影響まで深堀り。
ログインして利用🛡️ 読者ファクトチェック0
読者が投稿し、管理者承認後に表示される事実確認情報
まだ承認済みのファクトチェックはありません。
ファクトチェックを投稿するには ログイン が必要です
関連記事
こんな記事も読まれています
コメント (0)
コメント投稿にはログインが必要です。
まだコメントはありません。最初のコメントを書いてみましょう。
この記事について疑問がありますか?
事実誤認や不適切な内容について通報できます (要ログイン)。
異議申し立て・通報








