生成AIが「自己改善」する!Metaの事前学習に強化学習を組み込むLLM開発とは【話題の最新論文】 2026.2.12 Thu 16:21 【事前学習に強化学習を組み込む「自己改善型」LLM開発】大規模…