AIエージェント時代に対応する「MDium」:ローカル環境でOffice資産を活用するドキュメント基盤
本記事は、生成AI時代の到来に伴い、企業が抱える「社内文書(Office/PDF)のナレッジをAIに情報ロスなく渡すための土台作り」の重要性を指摘し、それに応えるデスクトップアプリケーション「MDium」を紹介している。従来のクラウド型ソリューション(例:SharePoint + Copilot)は便利だが、「ベンダーロックイン」のリスクを抱えているという問題意識から出発した。
MDiumは、Markdownを共通言語として据え、ローカル環境や社内ファイルサーバーのまま利用できるOSSベースのドキュメント基盤アプリである。その核となる機能は、Office/PDFといった多様なフォーマット(DOCX, XLSX, PDFなど)からMarkdownへの変換において、「情報ロス最小化」を徹底している点にある。特にExcel(XLSX/XLSM)からのデータ抽出においては、表検出やリッチテキストの保持に注力し、業務知識が詰まったデータをAIフレンドリーな形式に変換する高い精度を実現している。
さらにMDiumは単なるドキュメント基盤にとどまらず、「AI基盤」を統合している。これにより、社内ファイルサーバー上のUNCパスを指定するだけで、AIエージェント(Agentic RAG)が自律的にフォルダを探索・読解し、回答を引き出すことが可能となった。また、従来の埋め込みベースのRAGに加え、ベクトル検索とBM25によるハイブリッド検索も提供している。技術的な側面では、opencode-sdkを採用することでローカルでのAI処理基盤を構築し、さらにGUIを通じてエージェント定義やスキル(ハーネス)といった複雑な設定を誰もが扱えるように設計されている点が特徴的である。
加えて、マクロを含むExcelファイル(XLSM)のVBAコードをテキストとして展開・編集し、AIに書き直させ、再びExcelに戻す機能も実装されており、現場の業務フローへの深い対応を目指している。これにより、MDiumは「人間にもAIにもフレンドリー」な、自由度の高いローカルワークフローを実現することを目指している。
背景
生成AIが普及する中で、企業内の膨大なナレッジ(Office文書やPDFなど)をいかに効率的かつ正確にAIモデルに入力できるかが課題となっている。既存のクラウドソリューションは利便性が高いものの、特定のベンダーへの依存度が高く、データ主権や柔軟な運用面で懸念が指摘されていたため、オープンソース(OSS)によるローカル完結型の代替ソリューションが求められている。
重要用語解説
- Markdown: 軽量マークアップ言語の一つ。テキストの構造(見出し、リストなど)を記号を用いて記述し、HTMLなどのリッチフォーマットに変換する際に「共通言語」として利用される。情報ロスを防ぐための基盤となる。
- RAG (Retrieval-Augmented Generation): 大規模言語モデル(LLM)が回答を生成する際、外部のデータベースやドキュメントから関連情報を検索し、その根拠に基づいて回答を補強する技術。情報の正確性と信頼性を高める。
- Agentic RAG: 従来のRAGが「埋め込みインデックスによる検索」に依存するのに対し、AIエージェント自身がファイルシステム内を能動的に探索・読解しながら情報を収集し、回答に至るプロセスを指す。
今後の影響
本ツールは、企業の情報資産管理(DAM)と生成AI利用をローカル環境で統合することで、データ主権を確保しつつ高度な業務効率化を実現する可能性を持つ。特にベンダーロックイン懸念が強い大企業や機密性の高いデータを扱う現場において、新たな標準的なワークフロー基盤となることが期待される。今後の展開としては、より多くのフォーマット対応と、エンタープライズレベルでのセキュリティ認証取得が鍵となる。