News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2026年5月29日

    幻覚削減のための格子上のチェーンベース適応再構成

    大規模言語モデルにおけるテスト時の幻覚削減のための確率的フレームワークであるCAROL(Chain-based Adaptive Reconfiguration Over Lattices)を導入します。トークンレベルの不確実性に依存するのではなく、CAROLは生成された結果間の一貫性に基づいて意味的不確実性測度を定義します。

    arXiv cs.CL

  2. 2026年5月29日

    反応トーンを通じたコミュニティ態度のモデリング:オンラインコミュニティの言語的行動とLLMアラインメント評価のための人間-AI協働フレームワーク

    大規模言語モデル(LLM)は計算社会分析のプロキシとしてますます利用されていますが、人間のコミュニティの「厚い記述」を忠実に表現する能力は依然として重大な課題です。現在の評価では、社会的アイデンティティを静的なラベルに縮小することが多いです。

    arXiv cs.CL

  3. 2026年6月1日

    キャリブレーション済み選好学習:ラベルランキングの場合

    キャリブレーション(予測確率と真の結果頻度の整合)は信頼できる意思決定に不可欠である。分類と回帰で広く研究されている一方、確率的ラベルランキングにおけるキャリブレーションはまだ正式に取り組まれていない。ここで目標は分布を予測することである。

    arXiv cs.LG

  4. 2026年6月1日

    教師あり学習は生物学的に妥当な学習規則全体で初期視覚皮質アラインメントを急速に低下させる

    arXiv:2605.30556v1 発表タイプ:新規 要旨:ランダムで未訓練のニューラルネットワークは、初期視覚皮質への表現類似性において、訓練されたネットワークと一貫して同等以上の性能を示す。この驚くべき知見は、学習が脳アラインメントを改善するという仮定に異議を唱えている。我々は表現類似性分析(RSA)アラインメントを追跡することで調査する。

    arXiv cs.LG

  5. 2026年6月2日

    確率的勾配マルコフ連鎖モンテカルロを使用した正確な大標本不確実性定量化

    確率的勾配降下法(SGD)と確率的勾配ランジュバン動力学(SGLD)などのアルゴリズムの調整は、特にバッチサイズが大きい場合またはモデルが誤指定されている実際の関連設定では、近似サンプリングと不確実性定量化について課題が残ります。

    arXiv cs.LG

  6. 2026年6月2日

    ユニバーサル・クォンタム・トランスフォーマー

    arXiv:2606.00045v1発表タイプ:新規 抄録:古典的な連続空間ニューラルネットワークは、モジュロ演算や非可換代数などの厳密な数学的対称性にロックインするのに本質的に苦労している。これらの離散的な論理規則を近似するために、しばしば膨大なパラメータスケーリングに頼り、その後でも確率的不安定性をもたらす。

    arXiv cs.AI

  7. 2026年6月8日

    UnpredictaBench: LLMにおける分布的ランダム性を評価するためのベンチマーク

    大規模言語モデル(LLM)が真の基礎分布をキャプチャする能力をテストする評価指標UnpredictaBenchが導入されました。LLMが経済シミュレーションなど他の主体の代替として使用される場合が増えていますが、多くのモデルが単一の尤もらしい答えに収束する傾向があり、実際のシステムの予測不可能性を捉えられていません。出力の多様性向上に関する最近の研究は不十分で、シミュレーションには単なるバリエーション豊かな出力ではなく、目標分布に校正されたサンプルが必要です。UnpredictaBenchは、正規統計分布、確率的プログラムによる分布、ランダムプロセスを記述する自然言語シナリオを含む448個の問題を提示し、コルモゴロフ・スミルノフ統計検定を用いてモデルの出力が目標分布にどの程度近いかを定量化するKS@Nという評価指標を導入しています。複数のオープンソースモデルと商用モデルをテストした結果、分布能力に大きなばらつきが見られ、サンプルサイズ100(標準指標KS@100)での得点は0近くから20%以上まで分布し、どのモデルもKS@100で40%を超える成績を達成できていません。

    arXiv cs.CL

  8. 2026年6月9日

    形式言語タスクの学習可能性を因果的に評価する

    言語モデルのタスク学習に必要なデータ量を厳密に評価するため、研究チームは確率的有限オートマトンから生成される形式言語を使用しました。 従来の評価方法には欠陥があることを示し、因果分析を可能にする「ビニング半環」を導入しました。 実験結果は、因果的介入なしに学習可能性を評価することの限界を浮き彫りにしています。

    arXiv cs.CL

  9. 2026年6月11日

    介入するかしないか:確率的モデルブレンディングによる推論時アラインメントの誘導

    arXiv:2606.11201v1 新規発表 概要:LLMの広範な展開により、新たにトレーニングされたモデルがユーザーの指示に安全かつ効果的に応答するように、モデルアラインメントが必要となっています。様々な手法の中でも、推論時アラインメントは、出力生成中のみ介入(つまり、ガイダンスを提供する)するため、より安価であることが多いです。既存の提案では、信頼性を適切に評価せずに、特定の調整済みモデルから抽出されたガイダンスを適用しています。しかし、私たちの体系的な評価では、ガイダンスの効果はモデルによって劇的に異なることが明らかになりました。効果のないガイダンスは、さらなる混乱、ひいてはさらなる介入につながるため、結果として生じる過剰な介入は、通常、パフォーマンスの低下を示します。介入をより効果的かつ効率的にするため、私たちはBlendInを導入します。これは、二項決定から、両モデルの知識を統合したハイブリッド分布の作成へと移行する推論時アラインメントフレームワークです。

    arXiv cs.LG

  10. 2026年6月11日

    不完全な二値フィードバックを持つレストレスバンディット:PCLインデックス可能性の解析と計算

    arXiv:2606.11192v1 発表タイプ:新規 要旨:本研究では、センシングエラーを伴う機会的スペクトルアクセスに着想を得て、二値潜在状態と不完全な二値フィードバックを持つレストレスバンディットを研究します。関連する belief-state モデルに対し、実数状態割引レストレスバンディットの検証定理に基づき、インデックス可能性の確立とWhittleインデックスの評価のための partial conservation laws (PCL) ベースの解析的および計算的フレームワークを開発します。このフレームワークは、関連する決定論的スケルトン、更新分解、および単語上の組合せ論を通じて確率的ダイナミクスを解析します。これにより、いくつかの閾値レジームにおける割引報酬とリソースメトリクスについて解析可能な表現が得られ、そこでのPCLインデックス可能性条件の完全な検証が可能になります。本論文では完全な解析的検証が達成されていない残りのレジームについては、関連する周辺メトリクスと周辺生産性 (MP) インデックスを計算するための効率的な数値スキームを導出します。

    arXiv cs.LG

  11. 2026年6月16日

    GRASP:メモリ効率的なマルチソース学習のための勾配アラインメント逐次パラメータ転送

    マルチソース転送学習は、根本的なスケーラビリティのボトルネックに直面しています。既存のアプローチでは、パラメータ融合中にすべてのK個のソースモデルを同時にメモリにロードする必要があり、O(K)のメモリを必要とするか、推論時にすべてのモデルをデプロイする必要があり、本番環境へのデプロイを不可能にしています。我々は、GRASP(Gradient-Aligned Sequential Parameter Transfer)を提案します。これは、3つの主要なイノベーションにより、O(1)のメモリ消費を維持しながら、優れた知識統合を実現します。(1)ソースを一度に1つずつ進化するターゲットモデルにマージする逐次処理。(2)最適化方向がターゲットドメインと一致するパラメータのみを選択的に転送し、ネガティブ転送を回避するパラメータごとの勾配アラインメント。(3)次のソースを統合する前に、転送された知識を適応させる反復ファインチューニング。

    arXiv cs.LG

  12. 2026年6月16日

    融合は万能ではない:イベント発生までの時間モデリングのためのクロスモーダル表現アラインメント

    マルチモーダル臨床データからの正確なイベント発生までの時間(TTE)予測は、モダリティの不均衡と分布シフトにより依然として課題となっています。本研究では、CT画像と縦断的EHRデータ間のクロスモーダル表現アラインメントのための、タスクや施設を超えて汎用化できるように設計された、ファウンデーションモデル主導のフレームワークを提案します。CTとEHRのモダリティは、ドメイン固有のファウンデーションモデルを用いて個別にエンコードされ、4つの原則的な融合戦略(late fusion, contrastive alignment, cross-attention, co-attention)を通じて共有潜在空間でアラインメントされます。肺塞栓症(PE)の死亡率と心血管疾患(CVD)の転帰という、臨床的に異なる2つのTTEタスクを、大規模な複数施設コホート(PE: N=3,099学習; 1,098内部; 435外部; CVD: N=2,951学習; 837内部; 682外部)で評価しました。

    arXiv cs.AI

  13. 2026年6月18日

    人工ニューラルネットワークにおける衝撃波理論と対称性削減確率的勾配降下法の関連性

    微分幾何学、リー群論、流体力学に基づき、衝撃波理論と確率的勾配降下法の対称性商化学習ダイナミクスとの間の数学的に明確な関連性を開発しました。具体的には、パラメータ対称性を商化し、局所エントロピー粗視化を適用すると、有効ダイナミクスは商多様体上の粘性ハミルトン--ヤコビ方程式を満たします。さらに、生パラメータダイナミクスが商化空間上の勾配場によって要約できると仮定すると、粗視化された損失関数の勾配はバーガース型方程式に従い、衝撃形成を厳密に確立できます。この理論を多層パーセプトロン、畳み込みニューラルネットワーク、Transformer、平均場ネットワークに適用し、それらがハミルトン--ヤコビまたはバーガース型方程式に従うことを示しました。このフレームワークは、深層学習の実用的な診断も提供すると推測しています。Transformerのようなアーキテクチャでは、生パラメータノルムは対称性冗長性によってしばしば歪められ、誤解を招く可能性がありますが、対称性補正された商観測量は、トレーニングフェーズ遷移の監視、予測、制御のための原理的な基盤を提供します。

    arXiv cs.LG