Antigravityを活用したマルチモーダルRAGの実装と検証 | Logic & Artist

【使用ツール/スタック】

Orchestration: Antigravity
ローコードツールを基盤とすることで、複雑なAPI連携のプロトタイピング速度を最大化
Analysis: NotebookLM (検証中)
Database: Notion API (実装予定)
Format: PDF / HTML / Image

【現在のフェーズ：データ変換プロセスの最適化】

現在は、Antigravityを介した「Webコンテンツ→HTML/PDF変換」における情報の再現性維持が最大の技術課題となっている。

直面している課題: HTML変換時のレイアウト崩れによるコンテキストの欠落。
現在の試行: 従来のDOM解析（HTML）による情報抽出の限界を突破するため、マルチモーダルLLM（Vision API）を用いた視覚的構造解析へのシフトを検証中。

【最終目的】

インプットの自動化により、分析フェーズ（NotebookLM）への迅速な移行と、最終的なNotionでのナレッジ共有の完全自動化を目指す。

15年のCG制作で培った『画像構造への深い理解』を、マルチモーダルAIによる視覚的情報抽出（Vision-based RAG）に最適化させるアプローチを研究しています。