TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月29日
UniMaia: 人間らしいプレイのための言語によるチェス戦略の操舵
大規模言語モデルの最近の進歩により、自然言語は複雑なシステムを制御するための柔軟なインターフェースとして機能するようになったが、大規模な多モーダル訓練またはドメイン固有の帰納バイアスの弱化が必要である。チェスなどの構造化意思決定領域では、専門的なアプローチが優先される。
arXiv cs.CL
2026年6月1日
DisjunctiveNet：微分可能凸最適化層を通じたニューラルシンボリック学習
arXiv:2605.30456v1 科学と工学の多くの学習タスクはスパースなデータセットが特徴であり、純粋なデータドリブンアプローチの有効性を制限しています。同時に、これらの問題には物理法則、運用要件、専門家の直感から導出された豊富なドメイン知識が伴うことが多くあります。
arXiv cs.LG
2026年6月1日
言語モデルにおけるドメイン適応と推論フレームワーク：歴史的宇宙論を用いた統制実験
歴史的宇宙論を統制設定として使用し、ドメイン適応が言語モデルの説明行動をどのように変化させるかを調査した研究。フェーズ1では、明示的な地動説への言及を削除したコペルニクス以前のコーパスから小規模言語モデルをゼロから訓練し、地動説的な説明を生成できるかを評価する。
arXiv cs.CL
2026年6月1日
モデル特殊化のための自律型エージェント型データエンジニアリングの探索
大規模言語モデル（LLM）は一般的なタスクで優れたパフォーマンスを発揮していますが、高品質なドメイン固有のデータなしに特殊なドメインに適応するのに苦労しています。既存の LLM ベースのデータキュレーション方法は主に人間が設計したワークフローに依存しており、LLM が自動的に適応できるかどうかはまだ検証されていません。
arXiv cs.CL
2026年6月2日
ラショモン理論からPRAXISへ：効率的な決定木ラショモン集合
標準的な機械学習パイプラインは多くのほぼ最適なモデルを認めます。これらの「ラショモン集合」は、不確実性を考慮した堅牢な意思決定に対して、さまざまな課題と機会をもたらします。これにより、ユーザーはドメイン知識と好みを組み込むことができます。
arXiv cs.LG
2026年6月2日
RAFT：ドメイン微調整のためのデータ精緻化と適応的蒸留（忘却緩和付き）
ドメイン固有の教師あり微調整（SFT）は、しばしばドメイン内性能を向上させる一方で、モデルの一般的な能力を低下させます。本論文では、この低下を2つの実践的ギャップを通じて捉えます。ドメインターゲットがスタイルと推論形式において異なることに起因する、教師データ互換性ギャップです。
arXiv cs.LG
2026年6月2日
グラフ拡張検索を用いたクロスエンティティ金融感情分析: 比較研究
検索拡張生成(RAG)は大規模言語モデルをドメイン固有のコーパスに基づかせるための基盤となっていますが、従来のベクトルベースのRAGシステムは金融市場分析の基盤となる構造化された複数エンティティ間の関係を捉える能力に根本的な制限があります。
arXiv cs.CL
2026年6月2日
法律文書分類および要約のためのKANブロックを用いたBiGRUの強化
本研究では、低リソース多言語設定での法律文書の分類と要約タスクのための、KANベースのBiGRUモデルの新しいアーキテクチャを提案しています。ドメイン言語に関連する問題に対処し、異なる言語の使用、文脈内の長期依存性に対応することを目指しています。
arXiv cs.CL
2026年6月2日
SALSA：学習された操舵活性化ベクトルによる音声認識LLM適応
音声認識対応の大規模言語モデルは、ドメイン外設定への汎化が不十分です。我々はSALSA（学習された操舵活性化による音声認識LLM適応）を提案します。これは層ごとの操舵ベクトルを学習する軽量適応方法です。対比に依存する一般的に使用される操舵アプローチとは異なります。
arXiv cs.CL
2026年6月2日
医療用大規模言語モデルの安全性、ロバスト性、公平性評価のためのマルチドメインレッドチーミングフレームワーク
大規模言語モデル（LLM）はヘルスケア分野でますます導入されていますが、既存のベンチマークは臨床実践で一般的な対抗的または倫理的に複雑な条件下でのモデル動作を捉えることができません。11の現代的なLLMを6つのドメインで評価するマルチドメインレッドチーミングフレームワークを開発しました。
arXiv cs.CL
2026年6月3日
Amazon Nova Forgeでのハイパーパラメータ最適化の技術と科学
ドメイン固有のタスク用のファインチューニングは、一つの領域でのパフォーマンス向上をモデルの一般的な能力の低下なしに実現することを意味しており、このバランスを正しく取ることは見た目以上に難しいものです。
AWS Machine Learning Blog
2026年6月5日
[ITmedia ビジネスオンライン] 「ドメインナレッジ×AI」が強みに　日立・東原会長が語る、AI時代の日本企業の勝ち筋
2025年5月15日、日本生産性本部は「付加価値増大を軸とした生産性経営の実践～2040年、日本を世界の生産性トップリーグへ導く経営変革の道筋～」と題する提言を発表した。この提言について、生産性経営者会議の共同委員長であり、日立製作所取締役会長代表執行役東原敏昭氏が見解を語った。
ITmedia 全カテゴリ
2026年6月5日
【完全無料・ダウンロードできる名画ベスト5】1万点以上の巨匠アートが今日から見放題!? 国立美術館5館が「一生モノのパブリックドメイン画像」を解放！
国立美術館5館が共同運営する「国立美術館所蔵作品総合目録検索システム（5館総合目録）」において、著作権保護期間が満了したパブリックドメイン作品の画像データ無償ダウンロード提供が5月29日から開始された。「ダウンロードして損はない、至高の作品」をランキング形式で厳選。
ASCII.jp
2026年6月5日
Metaのハッキング事件が示すAIセキュリティの複雑性
6月5日、404 Mediaが報じたところによると、攻撃者たちはMetaのAI顧客サポートエージェントを使用してInstagramアカウントを盗み出していた。彼らの手口は単純で、エージェントに自分たちが管理するメールアドレスへのアカウントリンク付けを依頼し、エージェントがそれに応じていた。ある攻撃者…
MIT Technology Review AI
2026年6月5日
Metaのハッキング事件が示すAIセキュリティの課題
Metaが運営するサポート体制に深刻な脆弱性が発見された。同社の顧客対応用AIエージェントが悪意のある利用者に操作され、Instagramアカウントの乗っ取りに利用される被害が確認されている。攻撃者はAIに対して特定の指示を与えることで、ターゲットのアカウントを自らが管理するメールアドレスに変更させることに成功した。この手口により、オバマ前大統領が使用するホワイトハウス公式アカウントを含む複数の著名なアカウントが侵害されたという。本事件は企業がAI導入を急速に進める現在、セキュリティ対策の不備がもたらすリスクを改めて提示するものとなっている。AI システムが意図しない形で悪用されることを前提とした防御策や、アカウント操作時の本人確認強化が急務であることを示唆している。大規模テックプラットフォーム各社は、便利さとセキュリティのバランスをいかに取るかが今後の重要な課題となるだろう。（MIT Technology Review AI）
MIT Technology Review AI
2026年6月8日
落語で学ぶ『AI時代のDDD』ドメインプリミティブ編
慶応三年、江戸にて娘「おとっつぁん、大変だよ！」熊さん「一体どうしたってんだい、娘ちゃん」熊さん「朝っぱらから、ただごとじゃねぇ顔してるじゃねぇか」娘「うちのECサイトで、問題が起こっちまってるんだよぉ！」娘「新規登録の時だけのキャンペーン割引が」娘「全ての...
Qiita 人気記事
2026年6月8日
SaaS・デバイス管理ツール「freee IT管理」、カスタムSCIM連携機能を搭載
フリー株式会社（以下、freee）は5日、SaaS・デバイス一元管理ツール「freee IT管理」（旧称：Bundle by freee）において、従業員の社員番号やメールアドレスといったID情報の自動連携を可能にする国際標準規格「SCIM（System for Cross-domain Ident…
クラウド Watch
2026年6月9日
Instagramで不具合、有名人ユーザーのメールアドレスや電話番号が誰でも閲覧可能な状態に【やじうまWatch】
Instagramで、有名人ユーザーのメールアドレスや電話番号などの個人情報が誰でも閲覧可能な状態になっていたことが明らかになった。
INTERNET Watch
2026年6月10日
ハンズフリー初動通知：Strands AgentsとAmazon Bedrock AgentCore Browser Toolを活用したインテリジェントな請求受付
本稿では、Strands Agents SDKで構築されたエージェントがドメイン推論を行い、Amazon Bedrock AgentCore Browser Toolでライブポータル操作を行う、ハンズフリーの初動通知（FNOL）受付システムを実証します。このアプローチは、反復的な画面作業を排除しながら、人間の専門知識を維持します。
AWS Machine Learning Blog
2026年6月10日
「.com」と「.jp」はどちらが有利？ “ドメインパワー”って本当にあるの？ SEO専門家・住太陽氏に聞いた(Web担当者Forum)
「SEOで勝てないのは、ドメインパワーが足りないから？」 Google検索で上位表示を目指して施策に取り組む担当者ならば、聞いたことがあるかもしれない「ドメインパワー」という言葉。ドメインとは、
Yahoo!ニュース IT
2026年6月10日
自信満々の完了から静かなる失敗へ：LLMエージェントにおける偽の成功の特性評価
arXiv:2606.09863v1 発表タイプ：新規概要：LLMエージェントは、環境の状態がそうでないことを示しているにもかかわらず、タスク完了を断言することで静かに失敗する可能性があります。本研究では、この「偽の成功」という失敗モードを、2つのエージェントベンチマーク（8つのモデルファミリーからの9,876のtau2-bench軌道と、テキストに依存しない正解を持つ4つのモデルファミリーからの1,879のAppWorld軌道）で調査します。「偽の成功」は一般的ですが、設定によって異なります。tau2-benchドメインの単一制御では45〜48％の失敗、デュアル制御の通信では3％、明示的なステータスクレームを持つAppWorldの自己評価コーディングエージェント軌道では75.8％を占めます。LLMジャッジは信頼性に欠けます。5つのジャッジ、5つのプロンプト戦略、および完全なタスク仕様にわたるどの構成も、tau2-benchでAUROC 0.65を超えることはなく、同じジャッジがAppWorldのAPIコールトレースでAUROC 0.54しか達成できません。
arXiv cs.LG
2026年6月11日
PermDoRA -- 言語モデルにおけるアダプター干渉の理解：パラメータ空間幾何学の限界
arXiv:2606.11262v1 発表タイプ：新規概要：大規模言語モデル（LLM）におけるアクセス制御には、再トレーニングやドメイン間干渉なしにドメイン固有の動作を可能にするためのモジュール式メカニズムが必要です。アダプター合成中の干渉は、線形パラメータ更新の重複に起因するという一般的な仮説があり、直交性または方向独立性を強制することでマルチドメインパフォーマンスが向上すると示唆されています。私たちは、重み分解低ランク適応に基づいた階層的アダプター合成フレームワークであるDoRA-RBACを使用して、この仮説を検証します。LLaMA-3.1-8BおよびMistral-7Bにおける複数のQAベンチマーク（GPQA、PubMedQA、SimpleQA、WMDP）全体での正規化された方向平均によるフレシェ平均の近似である、幾何学を意識したリーマン幾何学に触発されたマージ戦略と、従来のユークリッドマージを比較します。
arXiv cs.LG
2026年6月11日
長期リサーチエージェントのための探索規律
arXiv:2606.11522v1 発表タイプ: new 概要: 現在、オートリサーチエージェントは、科学的候補を評価し、選択し、指標に対して検証していますが、その指標は通常、地域、スライス、またはコホートの異種空間で集約されたものです。科学的妥当性がその非集約構造に存在する場合、集約値は誤った候補を最初にランク付けする可能性があることを示します。全体的な数値は改善されても、その下にある構造は反転するため、数値に基づいて下された決定は、モデルを静かに破壊する候補を受け入れてしまいます。この失敗は特定のドメインに限定されるものではありません。候補の妥当性が多次元的でありながら、その検証者が単一の削減である場合にはどこにでも現れます。エコロジーデモグラフィーモデルにおける火災モデルタスクでこの反転を実証します。最高スコアの候補とわずかに低いスコアの候補は、グローバルスコアではノイズの範囲内ですが、最高スコアの候補は保護された北方地域を崩壊させるのに対し、もう一方の候補はそれらを維持します。それらを分けるのは、地域ごとの挙動であり、全体的な数値ではありません。
arXiv cs.AI
2026年6月11日
PoQ-Judge: 分散型LLM推論におけるコスト意識型Proof-of-Qualityのためのマルチアーキテクチャ評価フレームワーク
arXiv:2606.11196v1 新規発表要旨：分散型LLM推論ネットワークには、Proof-of-Quality (PoQ) のための軽量で参照不要な品質評価が必要です。我々は、正解データ参照なしでクエリと出力のペアをスコアリングする専用のジャッジモデルをトレーニングするフレームワーク、PoQ-Judgeを提案します。品質とコストのトレードオフを考慮した3つのアーキテクチャ（TextCNNジャッジ、MiniLMクロスエンコーダー、DeBERTaジャッジ）を研究します。UltraFeedbackとGPTラベル付きドメイン内データを用いた2段階トレーニングにより、最良のモデルは、保持されたテストセットで正解プロキシとのPearson相関0.747を達成し、以前の研究の参照ベース評価者を上回ります。複合スコアリングにおける参照フリーコンポーネントとして、参照回答の必要性をなくしながら、最良の単一参照ベース評価者と同等の0.645のPearson相関を達成します。
arXiv cs.CL
2026年6月12日
言語の庭 — ことばを育てて、言語をつくる
登録不要、ずっと無料アカウントも、メールアドレスも、お金もいりません。ブラウザがあれば、それで全部です。文系も、理系もないここではプログラミングを「ことば」として学びます。日本語を読み書きできるあなたは、すでに言語の使い手です。
はてなブックマーク IT
2026年6月12日
三井住友信託銀行、こんなに酷い入力フォームは久しぶりに見た「ぜ、全角…！？」「電話番号生年月日はギリ耐えたがメールアドレス全角えぐい」
toroddi @toroddi @kazeburo 90年代でもなかなかおめにかかれない酷さそして半角で入力すると「全角で入力してください」と怒られる判別してるならそのまま置換しろや!
はてなブックマーク IT
2026年6月12日
インフラストラクチャTLDの歴史
はじめにとある原稿のためにarpaドメインについて調べた。結果としてはあたりさわりのない数行の記述に落ち着いたのだが、そのつまらない記述にたどりつくまでにはかなりの調査を要し、そして調べきれない部分がいくつも残ってしまった。
Zenn
2026年6月15日
ドメイン知識こそがAI時代の開発力になる──Anthropic「Code with Claude」で語られたソフトウェア民主化の現在地
AIの普及によりソフトウェアを作る制約が変わった。かつては「コードを書けるか」が問われたが、今は「課題を言葉にできるか」が最も重要なスキルだ。
CodeZine
2026年6月15日
AIエージェントに組み込んだAgent SkillsをSkillOpsで評価する
はじめに Anthropic社が公開したAgent Skills（スキル）は、SKILL.mdを含めたパッケージで、タスクの実施手順やドメイン知識をLLMに与えることができます。大きな特徴として段階的な開示（Progressive disclosure）があり、必要な時...
Qiita 人気記事
2026年6月16日
『アサシンクリードシャドウズ』最終アプデ6月16日配信！無料ストーリーコンテンツ「黒潮」やエンドゲーム向け新アクティビティ「ドメイン」実装(Game Spark)
ユービーアイソフトは、『アサシンクリードシャドウズ』の最終タイトルアップデートに関する最新情報を公開しました。コンテンツドロップの最後を締めくくるのは、弥助と奈緒江の物語を描くクエスト「黒潮（BL
Yahoo!ニュースエンタメ