「AIがAIを訓練する」時代が来た — Adaption AutoScientistが変えるモデル学習の常識
Adaptionが公開したAutoScientistは、データとトレーニングレシピを自動で共同最適化するツール。勝率48%→64%の改善実績と仕組みを解説。
88件の記事
Adaptionが公開したAutoScientistは、データとトレーニングレシピを自動で共同最適化するツール。勝率48%→64%の改善実績と仕組みを解説。
Mac専用AIランタイムOsaurusをレビュー。Ollamaより20%高速、7MBのSwift製、MCP対応。ローカルLLMとクラウドAPIを1つのアプリで統合する設計思想と制約を解説。
OpenHumanは118以上の連携と10億トークンのメモリを持つOSSパーソナルAIエージェント。ローカル動作、設計思想、使い方を解説。
GLM-5.1・Kimi K2.6・DeepSeek V4・MiniMax M2.7を料金・性能で横並び比較。用途別の選び方を解説。
NVIDIA Nemotron 3 Nano Omniを解説。30B-A3Bの効率的なMoEアーキテクチャで画像・音声・動画を統合処理するオープンソースモデルの特徴と実用性。
SAPがn8nに戦略投資し評価額$5.2B(約8,000億円)に倍増。Joule Studioへのネイティブ統合の意味とZapier・Makeとの差を解説する。
Cline SDKはVS Code拡張の内部エージェントランタイムをオープンソース化したもの。アーキテクチャ、プラグイン、Kanbanボード、Claude Code SDKとの違いを解説。
Coder Agentsはセルフホスト型・モデル非依存のAIコーディングエージェント。コードを外部に送信せず自社インフラで完結する仕組みと、Cursor・Claude Codeとの違いを整理する。
OpenAIがPython開発ツール企業Astral(uv・Ruff・ty)を買収。月間1.26億DLのuvがCodexに統合される意味、OSSコミュニティの懸念、開発者が知っておくべきことを整理する。
Vercel Open Agentsはバックグラウンドで動くコーディングエージェントのOSSリファレンス実装。3層アーキテクチャの設計思想と使い方を解説。
RufloはClaude Code向けのマルチエージェントオーケストレーター。100+エージェントを並列実行し、API費用75%削減。GitHub 43kスターの実力を解説。
DeepSeek V4はPro/Flashの2構成。GPT-5.5比97%安でコーディング互角。料金と使い分けを解説。
Kimi K2.6はGPT-5.4超えの初オープンモデル。1T MoE、Ollama対応。スペックと料金を整理。
MiniMax M2.7は100回以上の自律改善ループで自身のスキャフォールドを最適化するオープンソースLLM。SWE-Pro 56%、入力$0.30/M。自己進化の仕組みと実際の使い道を整理した。
Qwen Code v0.15.0のセッション横断メモリ機能を解説。過去の会話から技術スタックやコーディング規約を自動記憶し、次のセッションに引き継ぐ仕組みと、Claude Codeとの違いを整理する。
OpenAI Chronicle有料化の48時間後に生まれたOSS。ローカル完結のAIメモリレイヤーの実力。
Mistral AIが128B旗艦モデル「Medium 3.5」とクラウド非同期コーディング「Vibe Remote Agents」を発表。SWE-Bench 77.6%、256kコンテキスト、オープンウェイト。性能・料金・使い方を解説。
Warpが全コードをAGPLv3で公開。GitHubで即座に3.9万スター。OSS化の背景とOzプラットフォームの戦略を解説。
OpenAI公式のSymphonyは、Linearのチケットを自動でPRに変換するOSSオーケストレーター。仕組みと導入条件を解説。
GitHub Trending 1位のOh My codeX(OmX)を解説。Codex CLIに並列チームモード、36スキル、MCPを追加するOSS。
Pioneer(Fastino)はプロンプト1つでLLMのファインチューニングからデプロイまでを自動化するAIエージェント。Adaptive Inferenceやサポートモデル、注意点を解説。
Qwen3.6-35B-A3Bは35Bパラメータのうち3Bだけ使う超効率MoEモデル。SWE-bench 73.4%の実力をOllamaでローカル実行する方法、27B Dense版との違いを解説。
Rowboatはメール・会議メモからナレッジグラフを自動構築するオープンソースAIコワーカー。ローカル動作でプライバシーを守りつつ、仕事の文脈を記憶し続ける仕組みを解説。
Hugging Face公式のOSSエージェント「ml-intern」を解説。arXiv論文の自動巡回からLLMのファインチューニング、評価まで自律実行する仕組みと実際の改善実績を紹介。
Tencentが295B MoEモデル「Hy3 Preview」をオープンソース公開。SWE-bench 74.4%の実力、入力0.18ドルの価格、既存サービスへの統合状況を解説する。
Nous ResearchのHermes Agentは自己学習型OSSエージェント。タスク完了後にスキルを自動生成し、次回以降40%速く処理する学習ループの仕組みと、OpenClawとの違いを解説。
Karpathyの観察から生まれたCLAUDE.mdスキルファイルがGitHub 7万スターを突破。LLMが過剰なコードを書く問題を4原則で解決する中身と、導入手順を解説する。
Alibaba発のQwen3.6-27Bは27Bパラメータの密モデルでClaude Opus 4.5級のコーディング性能を実現。RTX 4090で動くフロンティア級モデルの実力と限界を解説。
DeepSeek V4 ProとFlashが正式ローンチ。1.6TパラメータMoEでGPT-5.4・Claude Opus 4.6級の性能を、入力$0.14〜$1.74で提供。ベンチマーク・料金・実用性を整理する。
AIエージェント向けブラウザテストCLI「Expect」を解説。git diffからテスト計画を自動生成、Playwrightで実行、バグ動画を記録。Claude Code/Codex対応。
OverworldのWaypoint-1.5はゲーム映像をAIでリアルタイム生成するOSSワールドモデル。ローカルGPUで720p/60fps動作、技術の仕組みと可能性を解説。
ByteDance発のオープンソースマルチエージェントフレームワークDeerFlowを解説。Docker内でコードを実行し、リサーチからレポート作成まで自律で動く仕組みと使い所を整理する。
ClineとRoo Codeの両方をフォークしたOSSコーディングエージェントKilo Codeを解説。Agent Managerやマルチモデル比較など独自機能、料金、競合との違いを整理する。
Caltech発PrismMLの1ビットLLM「Bonsai」は80億パラメータを1.15GBに収め、iPhone上で毎秒44トークン生成する。量子化とは異なるネイティブ1ビット学習の仕組みと性能を解説。
ArchonはAIコーディングのワークフローをYAMLで定義し、再現可能にするOSSツール。GitHub 1.8万スター。Cursor・Claude Codeとの連携方法を解説。
Cline CLI 2.0が登場。並列エージェント、ヘッドレスCI/CD、ACP対応でターミナル完結のAI開発環境を実現。
VS Code/Cursor/Windsurf内で動くOSSデザインエージェントSuperdesignを解説。テキストからReact+Tailwindコードを10パターン生成、Webサイトクローン機能も。
Andrej Karpathy発のAutoResearchを解説。AIエージェントがコード修正→学習→評価を一晩中ループし、GPU1枚で100回以上の実験を自動実行する仕組み。
HeyGen発のOSSフレームワークHyperFramesを解説。HTML/CSS/JSで動画を作り、Claude Codeから1コマンドで実行できる仕組みと可能性を掘り下げる。
MemPalaceはローカル完結・無料のAIメモリシステム。Claude Code・ChatGPT・Cursorにセッションをまたぐ記憶を付与する。導入方法と仕組みを解説。
AlibabaのQwenチームが開発するオープンソースCLIコーディングエージェント「Qwen Code」。Claude CodeやCodex CLIとの違い、機能、使い方を整理する。
OpenYakはローカルで動くOSSのAIエージェント。46のMCPコネクタ、20以上のプロバイダー対応、メッセージング統合の実力を解説。
Qwen3.6-35B-A3BとGemma 4-31Bを主要ベンチマーク・VRAM消費・ライセンスで比較。用途別の選び方を整理した。
VoxCPM2は30言語対応・商用無料のOSS音声合成モデル。声を文章で設計できるボイスデザイン機能の仕組みと使い方を解説。
OpenHandsはDevinのOSS代替として急成長中のAIコーディングエージェント。セルフホスト・無料クラウドの使い方と弱点を整理。
GoogleがApache 2.0で公開したターミナルAIエージェント「Gemini CLI」を解説。無料でGemini 2.5 Proが使える仕組み、Claude Code・Codex CLIとの違い、MCP対応の実態を整理する。
米Arcee AIが400BのOSS推論モデルTrinity-Large-ThinkingをApache 2.0で公開。Claude Opus 4.6比96%安、長期エージェント特化の中身と評価を整理する。
Mistralがコード生成モデルCodestral 2をApache 2.0で公開。前モデルの商用制限が外れた意味、22Bのスペック、DeepSeek CoderやQwen3との立ち位置、ローカルで動かす現実的な使い道を整理する。
NVIDIAが量子コンピュータ向け初のオープンソースAIモデル群Isingを公開。誤り訂正とキャリブレーションをAIで高速化する中身、採用機関、量子株の反応を整理する。
2026年4月12日、Linuxカーネルプロジェクトが正式にAI生成コードの受け入れ方針を策定。Copilotは可、AIスロップは不可、責任は提出者という3点セットの中身と、なぜTorvaldsが態度を変えたのかを解説。
中国MiniMaxが2026年4月12日に公開したOSSのCLI「MMX-CLI」。Claude CodeやCursorに画像・動画・音声・音楽・検索の7モダリティをMCPなしで足せる。インストール手順と用途、MCPとの違いを整理する。
OpenClaw v2026.4.5が4月5日リリース。Light/REM/Deepの3段階メモリ統合Dreaming、xAI・Wan・Runway動画生成バンドル、12言語UI、ClawHub 44,000スキルの実態を解説する。
Metaが4月8日に発表したオープンソースのLlama 5を解説。600Bパラメータ・5Mコンテキスト・System 2思考の意味と、Muse Sparkとの関係を整理する。
Mozillaが4月9日に公開したOSSのAIセキュリティスキャナー0DIN。179のプローブでLLMのジェイルブレイクやプロンプトインジェクションを検査できる。GARAKとの違いと導入手順を解説する。
Datalabが公開したオープンソースOCRモデルChandra OCR 2を紹介。olmOCRベンチマーク85.9%、4Bパラメータ、手書き・表・数式・90言語対応。Gemini 2.5 Flashを上回った理由と実用シーンを整理する。
BlockのオープンソースAIエージェントGooseがLinux FoundationのAAIFに移管。Rust製、29K★、MCP 3000+ツール対応の実力と、Claude Code/Codex CLIとの立ち位置の違いを整理する。
Jack Dorsey率いるBlockのエンジニアが公開したOSSプロジェクトmesh-llmを解説。家のPCやMacのGPUをピアツーピアで束ね、単独では動かせない大規模モデルを分散実行する仕組みと使い所。
Microsoftが2026年4月2日に公開したAgent Governance Toolkitを解説。OWASP Agentic Top 10を全網羅し、0.1ms以下でポリシーを強制する実行時ガバナンス層。EU AI Act対応も視野に。
Dimensional/DimOSはROS不要のPython製エージェンティックロボットOS。GitHubで7万スターを集め、Unitree Go2を自然言語で動かせる。何が新しく、何がまだ足りないかを整理。
OpenBrowser-AIはCDP直叩き設計のOSSブラウザエージェント。LLMがPythonを永続名前空間で実行する方式で、browser-use等より2.6倍トークン効率を実現。仕組みと導入手順を解説。
Alibabaが自社開発を認めた15BのオープンソースAI動画モデルHappyHorse-1.0。Seedance 2.0を60点差で突き放した実力と、Apache 2.0で公開された意味を整理する。
AMDがLLM推論最適化エンジン「PACE」を公開。5th Gen EPYCでvLLMの1.6〜4.45倍の速度を達成。GPU不足時代のCPU推論という選択肢を整理する。
マルチエージェントフレームワークCrewAIを徹底レビュー。LangGraphとの違い、料金体系、実際の使い勝手を率直に解説
Jackrongが公開したQwen3.5-27B Claude-4.6-Opus-Reasoning-Distilledが、Hugging Face Trending1位に。Apache-2.0ライセンスでClaude風の<think>推論をローカル再現。v1/v2の違いとMLX/GGUF展開を整理する。
Microsoft MarkItDownは文書をMarkdownに変換するPythonユーティリティ。RAGやLLM前処理の標準ツール化した理由、MCP連携、実際の使い方と限界を整理する。
MiniMax M2.7は自身の訓練の30-50%を自律実行する「自己進化」型AI。10Bアクティブパラメータで業界トップ性能、価格は1/50。技術と意味を解説
Microsoft Phi-4-reasoningの推論性能・ベンチマーク・ローカル実行方法を解説。14Bパラメータでo3-miniに迫る数学・科学推論の実力とは
Claude Codeのソースコード漏洩事件をきっかけに誕生したOSSコーディングエージェント「Claw Code」。GitHub史上最速で17万スターに達した背景、使い方、法的リスクを整理する。
daVinci-MagiHumanは15BパラメータのOSSモデル。Apache 2.0で商用利用OK、日本語対応、HeyGen等の有料ツールに人間評価で勝率80%。使い方と限界を解説。
LTX DesktopはLightricksが開発した無料OSSのローカルAI動画生成アプリ。4K 50fps、音声付き、RTX 4090で動作。Runway・Klingとの比較と実用性を検証する。
Netflix初のオープンソースAI「VOID」をレビュー。動画から物体を消し影や物理的相互作用まで再現する仕組み、Runwayとの比較、使い方を解説
Apfelの機能・導入方法・活用シーンを解説。Apple SiliconのAIをターミナルから無料・ローカル・APIキー不要で使えるOSSツールの実力と制限
Cohere Transcribeの精度・日本語性能・制限を解説。WER 5.42%でWhisperを超えたオープンソース音声認識モデルの実力と、乗り換え判断のポイント
Google AI Edge GalleryでGemma 4をスマホ完全オフライン実行した実機レビュー。AIチャット・画像質問・音声書き起こし・Agent Skillsの4機能、動作環境、プライバシーの強みと課題を解説
Moonshot AIのKimi K2.5を徹底解説。1兆パラメータMoE、最大100エージェント並列実行のAgent Swarm、料金、使い方、メリット・デメリットがわかる
Gatsbyチーム発のTypeScript AIエージェントフレームワークMastraを実際に触ってレビュー。LangChain.jsやVercel AI SDKとの違いがわかる
n8n 2.0のAIエージェント構築機能、料金比較、セルフホストの利点を解説。Zapier・Makeとのコスト差と使い分けがわかる
Alibaba Qwen 3.5の全7モデルを徹底解説。9Bが30B超えの衝撃的なパラメータ効率、Ollamaでのローカル実行手順、GPT-5.2との性能比較がわかる。
完全無料のVS Code拡張Roo CodeをCursor・Copilot・Clineと比較。Custom Modesによるワークフロー最適化やモデル選択の自由度を実際に検証する。
MistralのVoxtral Transcribe 2を競合と徹底比較。話者分離・リアルタイム処理・オープンウェイトの3拍子でWhisperを超えた音声認識の実力と注意点を解説。
Browser Useの導入方法・ユースケース・料金を解説。自然言語でブラウザ操作を自動化するOSSツールの実力と、Selenium/Playwrightとの使い分けを整理
Clineの機能・実際のコスト・Cursorとの使い分けを解説。500万インストールの無料OSSコーディングエージェントがCursorの代替になるか検証
ノーコードAIエージェント開発プラットフォームDifyの実力を検証。LangChain・n8nとの違い、セルフホスト無料の強み、料金体系、Agentic RAGやMCP対応など2026年最新機能を解説
GoogleのLiteRT-LMを解説。スマホやRaspberry PiでLLMをローカル実行できるオープンソース推論フレームワークの機能と競合比較がわかる
Mistral Small 4とVoxtral TTSを解説。ローカル実行可能な高品質音声合成モデルの性能、Le Chatの新機能、開発者向けの活用法がわかる
OpenAI Codex CLIの機能・サンドボックス設計・Agents SDKをClaude Codeと徹底比較。ターミナルAIコーディングの選び方がわかる
GitHub35万スターのAIアシスタントOpenClawの機能・セキュリティ脆弱性・Anthropicとの対立を徹底検証。導入前に知るべきリスクと対策を解説する。
OpenCodeとClaude Codeを実際に使い比べ、性能・コスト・モデル自由度を正直に比較。月額$0で始められるOSSターミナルAIコーディングの実力を検証する。