智慧文件理解

AI ↔ AI

OCR 提取、實體識別、關係對應與知識圖譜建構。

5 個節點 · 5 條連接enterprise
agentdbsystem
視覺化
OCR 提取代理人agent

將掃描 PDF 與圖像轉換為保留排版的結構化文字。

sequential實體識別代理人
實體識別代理人agent

識別人物、組織、日期、金額與領域特定實體。

sequential關係對應代理人
fallbackOCR 提取代理人
關係對應代理人agent

偵測實體間的關係:所有權、僱傭關係、合約義務。

sequential知識圖譜代理人
知識圖譜代理人agent

將提取的關係合併至具去重功能的持久化知識圖譜中。

sequential結構化輸出
結構化輸出api

匯出 JSON-LD、CSV 或圖形資料庫三元組,供下游系統使用。

uc-document-understanding.osop.yaml
osop_version: "1.0"
id: "document-understanding"
name:"智慧文件理解"
description:"OCR 提取、實體識別、關係對應與知識圖譜建構。"

nodes:
  - id: "ocr_extract"
    type: "agent"
    subtype: "worker"
    name: "OCR 提取代理人"
    description: "將掃描 PDF 與圖像轉換為保留排版的結構化文字。"

  - id: "entity_recognition"
    type: "agent"
    subtype: "llm"
    name: "實體識別代理人"
    description: "識別人物、組織、日期、金額與領域特定實體。"

  - id: "relationship_map"
    type: "agent"
    subtype: "llm"
    name: "關係對應代理人"
    description: "偵測實體間的關係:所有權、僱傭關係、合約義務。"

  - id: "knowledge_graph"
    type: "agent"
    subtype: "llm"
    name: "知識圖譜代理人"
    description: "將提取的關係合併至具去重功能的持久化知識圖譜中。"

  - id: "structured_output"
    type: "api"
    name: "結構化輸出"
    description: "匯出 JSON-LD、CSV 或圖形資料庫三元組,供下游系統使用。"

edges:
  - from: "ocr_extract"
    to: "entity_recognition"
    mode: "sequential"
  - from: "entity_recognition"
    to: "relationship_map"
    mode: "sequential"
  - from: "relationship_map"
    to: "knowledge_graph"
    mode: "sequential"
  - from: "knowledge_graph"
    to: "structured_output"
    mode: "sequential"
  - from: "entity_recognition"
    to: "ocr_extract"
    mode: "fallback"
    label: "Low confidence entities, re-OCR with enhanced preprocessing"