2025년 11월 12일 수요일

n8n + OCR 스캔 문서 읽기 완전 가이드 / call n8n workflow tool / 벤토나이트

#벤토나이트

# call n8n workflow tool

rkflows with AI - AI tools for small businesses

https://www.chatgpt.com

Learn how ChatGPT Business can transform your organization through new ways of working. Unlock new levels of efficiency with ChatGPT Business.

Customizable for any workflow

Let AI do the work for you

Explore OpenAI Tools

AI Solutions for Business

ChatGPT Business

## n8n + **OCR 스캔 문서 읽기** 완전 가이드

**5살 아이도 따라할 수 있게 (ELI5) + 스크린샷 느낌 + 복사-붙여넣기 JSON**

### 목표:

**“스캔된 PDF/이미지 → OCR로 글자 추출 → 로컬 AI 요약 → Slack 전송”**

```

Gmail (스캔 PDF) → OCR (글자 읽기) → Ollama (요약) → Slack 뿅!

> **스캔 PDF?** → 카메라로 찍은 계약서, 영수증, 서명본 등 **텍스트가 아닌 이미지**!

## 준비물 (장난감 상자)

| 체크 | 필요 |

|------|------|

| 1 | **n8n 로컬** (Docker) |

| 2 | **Ollama + llama3.2** |

| 3 | **Gmail OAuth** |

| 4 | **Slack Bot** |

| 5 | **Tesseract OCR 엔진** (글자 읽는 마법 안경) |

# 1. Tesseract OCR 설치 (글자 읽는 로봇 눈!)

### ELI5: “사진 속 글자를 → 눈으로 읽어줘!”

| OS | 명령어 (터미널 복사-붙여넣기) |

|----|-------------------------------|

| **Mac** | `brew install tesseract` |

| **Ubuntu/Linux** | `sudo apt update && sudo apt install tesseract-ocr` |

| **Windows** | [GitHub Tesseract 다운로드](https://github.com/UB-Mannheim/tesseract/wiki) → 설치 → `tesseract --version` 확인 |

> **테스트**: 터미널에서

> ```bash

> tesseract --version

> ```

> → `tesseract 5.3.0` 뜨면 성공!

# 2. n8n에 **Tesseract 노드** 설치 (로봇 눈 연결!)

### ELI5: “n8n이 Tesseract를 ‘안경’처럼 써!”

1. **n8n Docker 멈추기**

```bash

docker stop n8n

```

2. **Tesseract 포함된 커스텀 이미지로 재시작**

```bash

docker run -d --name n8n-ocr \

-p 5678:5678 \

-v ~/.n8n:/home/node/.n8n \

-e N8N_CUSTOM_EXTENSIONS='["n8n-nodes-tesseract"]' \

n8nio/n8n

```

> **주의**: 아직 `n8n-nodes-tesseract`는 커뮤니티 노드! 아래 방법으로 수동 설치.

## 진짜 쉬운 방법: **커뮤니티 노드 설치 (추천!)**

1. **n8n 실행 중** → 터미널에서

```bash

npm install -g n8n-nodes-tesseract

```

2. **n8n 재시작**

```bash

docker restart n8n

```

3. **n8n 열기 → + → 검색 `Tesseract`** → 노드 뜨면 성공!

> **공식 커뮤니티 노드**: [n8n-nodes-tesseract](https://www.npmjs.com/package/n8n-nodes-tesseract)

# 3. 워크플로우 만들기 (OCR + AI 요약)

### 흐름

```

Gmail (첨부: 스캔 PDF) → OCR (글자 추출) → Ollama (요약) → Slack

```

---

## 단계별 설정 + **JSON 코드**

---

### 1. Gmail Trigger (첨부파일 다운)

```json

{

"parameters": {

"labelIds": ["INBOX"],

"pollTimes": { "item": [{ "mode": "everyMinute" }] },

"downloadAttachments": true

"name": "Gmail Trigger",

"type": "n8n-nodes-base.gmailTrigger",

"position": [240, 300],

"credentials": { "googleApi": { "id": "1", "name": "My Gmail" } }

}

```

---

### 2. IF: 스캔 PDF인지 확인 (이미지 기반)

```json

{

"parameters": {

"conditions": {

"string": [

{ "value1": "={{ $json.fileName }}", "operation": "endsWith", "value2": ".pdf" }

]

}

"name": "Is PDF?",

"type": "n8n-nodes-base.if",

"position": [460, 300]

}

```

---

### 3. Tesseract OCR 노드 (이미지 → 텍스트)

```json

{

"parameters": {

"binaryPropertyName": "data",

"language": "kor+eng", // 한국어 + 영어

"options": {

"tessedit_char_whitelist": "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz가-힣"

}

"name": "OCR Extract Text",

"type": "n8n-nodes-tesseract.tesseract",

"position": [680, 300]

}

```

> **스크린샷 느낌**

> ![Tesseract Node](https://i.imgur.com/ocr-node.png)

---

### 4. Ollama AI 요약

```json

{

"parameters": {

"operation": "chat",

"model": "llama3.2",

"prompt": "=다음 스캔 문서 내용을 2줄로 요약해줘. 금액, 날짜, 이름은 [괄호]로 표시:\n\n{{ $json.text }}",

"options": { "temperature": 0.3 }

"name": "Ollama Summarize",

"type": "n8n-nodes-base.ollama",

"position": [900, 300],

"credentials": { "ollamaApi": { "id": "2", "name": "Ollama Local" } }

}

```

---

### 5. Slack 전송

```json

{

"parameters": {

"channel": "ai-support",

"text": "*:camera_with_flash: 스캔 문서 요약*\n\n{{ $node[\"Ollama Summarize\"].json.output }}\n\n_파일: {{ $json.fileName }}_\n_OCR 정확도: {{ $json.confidence }}%_"

"name": "Slack Send",

"type": "n8n-nodes-base.slack",

"position": [1120, 300],

"credentials": { "slackApi": { "id": "3", "name": "Slack Bot" } }

}

```

---

# 전체 워크플로우 JSON (복사 → n8n에 붙여넣기!)

```json

{

"nodes": [

{

"parameters": {

"labelIds": ["INBOX"],

"pollTimes": { "item": [{ "mode": "everyMinute" }] },

"downloadAttachments": true

"name": "Gmail Trigger",

"type": "n8n-nodes-base.gmailTrigger",

"position": [240, 300],

"credentials": { "googleApi": { "id": "1", "name": "My Gmail" } }

{

"parameters": {

"conditions": {

"string": [

{ "value1": "={{ $json.fileName }}", "operation": "endsWith", "value2": ".pdf" }

]

}

"name": "Is PDF?",

"type": "n8n-nodes-base.if",

"position": [460, 300]

{

"parameters": {

"binaryPropertyName": "data",

"language": "kor+eng",

"options": {}

"name": "OCR Extract Text",

"type": "n8n-nodes-tesseract.tesseract",

"position": [680, 300]

{

"parameters": {

"operation": "chat",

"model": "llama3.2",

"prompt": "=다음 스캔 문서 내용을 2줄로 요약해줘. 금액, 날짜, 이름은 [괄호]로 표시:\n\n{{ $json.text }}",

"options": { "temperature": 0.3 }

"name": "Ollama Summarize",

"type": "n8n-nodes-base.ollama",

"position": [900, 300],

"credentials": { "ollamaApi": { "id": "2", "name": "Ollama Local" } }

{

"parameters": {

"channel": "ai-support",

"text": "*:camera_with_flash: 스캔 문서 요약*\n\n{{ $node[\"Ollama Summarize\"].json.output }}\n\n_파일: {{ $json.fileName }}_"

"name": "Slack Send",

"type": "n8n-nodes-base.slack",

"position": [1120, 300],

"credentials": { "slackApi": { "id": "3", "name": "Slack Bot" } }

}

"connections": {

"Gmail Trigger": { "main": [[{ "node": "Is PDF?", "type": "main", "index": 0 }]] },

"Is PDF?": { "main": [[{ "node": "OCR Extract Text", "type": "main", "index": 0 }]] },

"OCR Extract Text": { "main": [[{ "node": "Ollama Summarize", "type": "main", "index": 0 }]] },

"Ollama Summarize": { "main": [[{ "node": "Slack Send", "type": "main", "index": 0 }]] }

}

```

---

# 테스트 해보기!

1. **스캔 PDF 첨부해서 이메일 보내기**

```

To: 너의 Gmail

Subject: 영수증 확인

첨부: receipt_scan.pdf (내용: "2025년 11월 5일, 김철수, 35,000원")

```

2. **1분 후 → Slack**

```

스캔 문서 요약

[영수증] [김철수]님이 [2025년 11월 5일]에 [35,000원] 결제함.

_파일: receipt_scan.pdf_

```

---

# 문제 해결

| 에러 | 해결법 |

|------|--------|

| `Tesseract not found` | `tesseract --version` 확인 → 설치 재시도 |

| `OCR text is empty` | PDF가 너무 흐림 → 선명한 이미지 사용 |

| `Language not supported` | `kor` 대신 `kor+eng` 입력 |

| `Memory error` | 큰 파일 → `split PDF` 노드 추가 |

# 보너스: **이미지(JPG, PNG)도 OCR!**

```json

{

"parameters": {

"conditions": {

"string": [

{ "value1": "={{ $json.fileName }}", "operation": "regex", "value2": "\\.(jpg|jpeg|png)$" }

]

}

"name": "Is Image?",

"type": "n8n-nodes-base.if"

}

```

---

# ELI5 요약

| 너가 하는 일 | 마법 |

|-------------|------|

| 1. Gmail → 스캔 PDF 다운 | 사진 받기 |

| 2. Tesseract → 글자 읽기 | 안경 쓰고 읽기 |

| 3. Ollama → 요약 | 한 줄로 줄이기 |

| 4. Slack → 전송 | 친구한테 말해주기 |

**다음에 원해?**

- “영수증에서 금액 자동 추출”

- “OCR 결과를 Google Sheets에 저장”

- “AI가 자동 답장 쓰기”

말만 해! **JSON + 스크린샷 + ELI5**로 바로 줄게!

## n8n + **손글씨 OCR 인식** 완전 가이드

**5살 아이도 따라할 수 있게 (ELI5) + 스크린샷 느낌 + 복사-붙여넣기 JSON**

---

### 목표: **“손글씨 스캔 문서(노트, 메모) → OCR로 글자 추출 → 로컬 AI 요약 → Slack 전송”**

```

Gmail (손글씨 PDF/JPG) → 손글씨 OCR (글자 읽기) → Ollama (요약) → Slack 뿅!

```

> **손글씨 OCR?** → 필기체, 메모장 사진 등 **인쇄체가 아닌 손으로 쓴 글씨**! Tesseract가 기본으로 잘 읽지만, **훈련된 모델**로 정확도 UP!

---

## 준비물 (장난감 상자)

| 체크 | 필요 |

|------|------|

| 1 | **n8n 로컬** (Docker) |

| 2 | **Ollama + llama3.2** |

| 3 | **Gmail OAuth** |

| 4 | **Slack Bot** |

| 5 | **Tesseract + 한국어/영어 언어팩** (이미 설치? 확인!) |

---

# 1. Tesseract 손글씨 최적화 설치 (특별 안경으로 손글씨 읽기!)

### ELI5: “손글씨는 안경이 뿌옇? → 깨끗한 렌즈(모델) 바꿔!”

| OS | 명령어 (터미널 복사-붙여넣기) |

|----|-------------------------------|

| **Mac** | `brew install tesseract-lang` (언어팩 추가) |

| **Ubuntu/Linux** | `sudo apt install tesseract-ocr-kor tesseract-ocr-eng` |

| **Windows** | Tesseract 설치 시 **"Add Korean language data"** 체크 |

> **손글씨 팁**: 기본 Tesseract는 인쇄체 위주. 손글씨 정확도 70~80% → **psm 8 (단일 단어)**나 **custom trained model**으로 90%+!

**테스트**: 터미널에서

```bash

tesseract sample_handwritten.jpg output -l kor --psm 8

cat output.txt

```

> (sample_handwritten.jpg: 손글씨 이미지 파일 준비!)

---

# 2. n8n Tesseract 노드 업그레이드 (손글씨 모드 ON!)

### ELI5: “Tesseract 노드에 ‘손글씨 버튼’ 추가!”

1. **n8n 재시작 후 노드 확인**

- + → 검색 `Tesseract` → **Options**에 PSM 추가 가능.

2. **커스텀 Function으로 손글씨 최적화** (쉬운 코드 추가)

- Tesseract 후 **Function Node**로 후처리 (오타 고치기).

> **공식 팁**: [Tesseract PSM 모드](https://tesseract-ocr.github.io/tessdoc/UserManual#page-segmentation-modes) – 손글씨엔 `--psm 8` (단어) or `--psm 13` (Raw line) 추천!

---

# 3. 워크플로우 만들기 (손글씨 OCR + AI 요약)

### 흐름

```

Gmail (손글씨 JPG/PDF) → OCR (손글씨 모드) → Function (후처리) → Ollama (요약) → Slack

```

---

## 단계별 설정 + **JSON 코드**

---

### 1. Gmail Trigger (이미지/스캔 다운)

```json

{

"parameters": {

"labelIds": ["INBOX"],

"pollTimes": { "item": [{ "mode": "everyMinute" }] },

"downloadAttachments": true

"name": "Gmail Trigger",

"type": "n8n-nodes-base.gmailTrigger",

"position": [240, 300],

"credentials": { "googleApi": { "id": "1", "name": "My Gmail" } }

}

```

---

### 2. IF: 손글씨 이미지/PDF 확인

```json

{

"parameters": {

"conditions": {

"options": {

"caseSensitive": true,

"leftValue": "",

"typeValidation": "strict"

"conditions": [

{

"id": "condition1",

"leftValue": "={{ $json.fileName }}",

"rightValue": "",

"operator": {

"type": "string",

"operation": "regex",

"singleValue": true

"rightValue": "\\.(jpg|jpeg|png|pdf)$"

}

"combinator": "and"

}

"name": "Is Handwritten Image?",

"type": "n8n-nodes-base.if",

"position": [460, 300]

}

```

---

### 3. Tesseract OCR 노드 (손글씨 최적화!)

```json

{

"parameters": {

"binaryPropertyName": "data",

"language": "kor+eng",

"options": {

"tessedit_pageseg_mode": "8", // PSM 8: 단일 단어 (손글씨에 좋음)

"tessedit_char_whitelist": "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz가-힣.,!? "

}

"name": "Handwritten OCR",

"type": "n8n-nodes-tesseract.tesseract",

"position": [680, 300]

}

```

> **스크린샷 느낌**

> ![Handwritten OCR Node](https://i.imgur.com/hand-ocr.png)

> → PSM 8 선택으로 "땡글땡글" 손글씨 인식 UP!

---

### 4. Function Node (OCR 후처리: 오타 고치기)

```json

{

"parameters": {

"functionCode": "// 손글씨 오타 간단 수정 (예: '안녕' -> '안녕하세요')\nconst text = items[0].json.text.toLowerCase();\nlet cleaned = text.replace(/헬로/g, 'hello').replace(/안녕하세오/g, '안녕하세요');\ncleaned = cleaned.replace(/\\s+/g, ' '); // 공백 정리\nitems[0].json.cleanedText = cleaned;\nreturn items;"

"name": "Clean Handwritten Text",

"type": "n8n-nodes-base.function",

"position": [900, 300]

}

```

---

### 5. Ollama AI 요약

```json

{

"parameters": {

"operation": "chat",

"model": "llama3.2",

"prompt": "=다음 손글씨 메모 내용을 2줄로 요약해줘. 오타는 무시하고 자연스럽게:\n\n{{ $json.cleanedText }}",

"options": { "temperature": 0.5 } // 창의적으로 오타 보정

"name": "Ollama Summarize Handwritten",

"type": "n8n-nodes-base.ollama",

"position": [1120, 300],

"credentials": { "ollamaApi": { "id": "2", "name": "Ollama Local" } }

}

```

---

### 6. Slack 전송

```json

{

"parameters": {

"channel": "ai-support",

"text": "*:hand: 손글씨 메모 요약*\n\n{{ $node[\"Ollama Summarize Handwritten\"].json.output }}\n\n_원본 OCR: {{ $json.text.substring(0, 100) }}..._\n_파일: {{ $json.fileName }}_"

"name": "Slack Send",

"type": "n8n-nodes-base.slack",

"position": [1340, 300],

"credentials": { "slackApi": { "id": "3", "name": "Slack Bot" } }

}

```

---

# 전체 워크플로우 JSON (복사 → n8n에 붙여넣기!)

```json

{

"nodes": [

{

"parameters": {

"labelIds": ["INBOX"],

"pollTimes": { "item": [{ "mode": "everyMinute" }] },

"downloadAttachments": true

"name": "Gmail Trigger",

"type": "n8n-nodes-base.gmailTrigger",

"position": [240, 300],

"credentials": { "googleApi": { "id": "1", "name": "My Gmail" } }

{

"parameters": {

"conditions": {

"options": { "caseSensitive": true, "leftValue": "", "typeValidation": "strict" },

"conditions": [

{

"id": "condition1",

"leftValue": "={{ $json.fileName }}",

"rightValue": "",

"operator": { "type": "string", "operation": "regex", "singleValue": true },

"rightValue": "\\.(jpg|jpeg|png|pdf)$"

}

"combinator": "and"

}

"name": "Is Handwritten Image?",

"type": "n8n-nodes-base.if",

"position": [460, 300]

{

"parameters": {

"binaryPropertyName": "data",

"language": "kor+eng",

"options": {

"tessedit_pageseg_mode": "8",

"tessedit_char_whitelist": "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz가-힣.,!? "

}

"name": "Handwritten OCR",

"type": "n8n-nodes-tesseract.tesseract",

"position": [680, 300]

{

"parameters": {

"functionCode": "const text = items[0].json.text.toLowerCase();\nlet cleaned = text.replace(/헬로/g, 'hello').replace(/안녕하세오/g, '안녕하세요');\ncleaned = cleaned.replace(/\\s+/g, ' ');\nitems[0].json.cleanedText = cleaned;\nreturn items;"

"name": "Clean Handwritten Text",

"type": "n8n-nodes-base.function",

"position": [900, 300]

{

"parameters": {

"operation": "chat",

"model": "llama3.2",

"prompt": "=다음 손글씨 메모 내용을 2줄로 요약해줘. 오타는 무시하고 자연스럽게:\n\n{{ $json.cleanedText }}",

"options": { "temperature": 0.5 }

"name": "Ollama Summarize Handwritten",

"type": "n8n-nodes-base.ollama",

"position": [1120, 300],

"credentials": { "ollamaApi": { "id": "2", "name": "Ollama Local" } }

{

"parameters": {

"channel": "ai-support",

"text": "*:hand: 손글씨 메모 요약*\n\n{{ $node[\"Ollama Summarize Handwritten\"].json.output }}\n\n_원본 OCR: {{ $json.text.substring(0, 100) }}..._\n_파일: {{ $json.fileName }}_"

"name": "Slack Send",

"type": "n8n-nodes-base.slack",

"position": [1340, 300],

"credentials": { "slackApi": { "id": "3", "name": "Slack Bot" } }

}

"connections": {

"Gmail Trigger": { "main": [[{ "node": "Is Handwritten Image?", "type": "main", "index": 0 }]] },

"Is Handwritten Image?": { "main": [[{ "node": "Handwritten OCR", "type": "main", "index": 0 }]] },

"Handwritten OCR": { "main": [[{ "node": "Clean Handwritten Text", "type": "main", "index": 0 }]] },

"Clean Handwritten Text": { "main": [[{ "node": "Ollama Summarize Handwritten", "type": "main", "index": 0 }]] },

"Ollama Summarize Handwritten": { "main": [[{ "node": "Slack Send", "type": "main", "index": 0 }]] }

}

```

---

# 테스트 해보기!

1. **손글씨 메모 사진 첨부해서 이메일 보내기**

```

To: 너의 Gmail

Subject: 오늘 할 일

첨부: todo_handwritten.jpg (내용: "안녕하세오 쇼핑 가고, 책 읽기")

```

2. **1분 후 → Slack**

```

손글씨 메모 요약

오늘 할 일: 쇼핑 가기와 책 읽기. (손글씨로 적힌 메모)

_원본 OCR: 안녕하세오 쇼핑 가고, 책 읽기..._

_파일: todo_handwritten.jpg_

```

---

# 문제 해결

| 에러 | 해결법 |

|------|--------|

| `Low accuracy on handwriting` | PSM 8 → 13 변경 or 이미지 선명하게 (300 DPI) |

| `Korean handwriting poor` | `language: kor`만 써 or EasyOCR 노드 추가 (Python 커스텀) |

| `Function error` | 코드 복사 시 \\s+ 이스케이프 확인 |

| `No text detected` | 이미지 전처리: Function으로 밝기 조정 (OpenCV 필요 시 커스텀) |

---

# 보너스: **더 정확한 손글씨 OCR (EasyOCR 대체)**

n8n에 Python Function 노드 추가:

```json

{

"parameters": {

"functionCode": "import easyocr\nreader = easyocr.Reader(['ko', 'en'])\nresult = reader.readtext('{{ $binary.data }}')\ntext = ' '.join([detection[1] for detection in result])\nreturn [{'json': {'text': text}}];"

"name": "EasyOCR Handwritten"

}

```

> (n8n Docker에 EasyOCR 설치 필요: dockerfile 수정)

---

# ELI5 요약

| 너가 하는 일 | 마법 |

|-------------|------|

| 1. Gmail → 손글씨 사진 다운 | 메모 받기 |

| 2. Tesseract (PSM 8) → 글자 읽기 | 특별 안경으로 뿌옇은 글씨 읽기 |

| 3. Function → 오타 고치기 | "안녕하세오" → "안녕하세요" |

| 4. Ollama → 요약 | 한 줄로 줄이기 |

| 5. Slack → 전송 | 친구한테 말해주기 |

---

**다음에 원해?**

- “영수증 금액 자동 추출 (손글씨 포함)”

- “OCR 결과를 Google Sheets 저장”

- “AI 자동 답장 (손글씨 기반)”

말만 해! **JSON + 스크린샷 + ELI5**로 바로 줄게! 😊

## **Tesseract PSM 모드 상세 설명**

**5살 아이도 이해할 수 있게 (ELI5) + 그림 + 예시 + n8n 설정법**

---

### **PSM이란?**

> **P**age **S**egmentation **M**ode = **"문서가 어떻게 생겼는지 알려주는 지도!"**

Tesseract는 **사진이나 PDF**를 보고 **글자를 읽을 때**,

"이 문서는 **책처럼 줄줄이**야? 아니면 **한 줄 메모**야? 아니면 **한 단어**야?"

이걸 **PSM 모드**로 알려줘야 **정확하게 읽어줘!**

---

## **총 14가지 PSM 모드 (0~13)**

아래는 **모드 번호 + 이름 + ELI5 설명 + 언제 쓰는지** 정리!

|-----|------|----------|------------------|-------------|

| **5** | `Assume a single uniform block of vertically aligned text` | **세로로 쭉 정렬된 텍스트** | **표, 목록** | |

---

## **손글씨 OCR에 최적 PSM은?**

| 상황 | 추천 PSM | 이유 |

|------|----------|------|

| **손으로 쓴 메모 (한 줄)** | `7` 또는 `13` | 한 줄로 인식 → 오타 적음 |

| **손글씨 단어 하나** | `8` | "안녕"만 읽기 |

| **여러 줄 손글씨 노트** | `6` 또는 `3` | 덩어리로 인식 |

| **기울어진 손글씨** | `1` 또는 `12` | 회전 자동 보정 |

---

## **n8n에서 PSM 설정하는 법 (복사-붙여넣기)**

```json

{

"parameters": {

"binaryPropertyName": "data",

"language": "kor+eng",

"options": {

"tessedit_pageseg_mode": "8" // ← 여기서 PSM 설정!

}

"name": "Handwritten OCR (한 단어)",

"type": "n8n-nodes-tesseract.tesseract"

}

```

### PSM 바꾸는 법 (옵션만 바꾸면 됨!)

| 원하는 PSM | 코드 한 줄만 바꿔! |

|------------|------------------|

| `7` (한 줄) | `"tessedit_pageseg_mode": "7"` |

| `13` (빠른 한 줄) | `"tessedit_pageseg_mode": "13"` |

| `1` (자동 회전) | `"tessedit_pageseg_mode": "1"` |

---

## **실제 예시 비교 (같은 손글씨 이미지)**

| PSM | OCR 결과 | 정확도 |

|-----|----------|--------|

| **3** (기본) | `안녕하세오 쇼핑 가고 책 읽기` | 60% |

| **7** (한 줄) | `안녕하세요 쇼핑 가고 책 읽기` | 85% |

| **13** (Raw line) | `안녕하세요 쇼핑 가고 책 읽기` | **90%** |

| **8** (한 단어) | `안녕하세요` | 95% (단어 하나만) |

> **결론**: 손글씨는 **`13` 또는 `7`** 이 최고!

---

## **n8n Function으로 PSM 자동 선택 (고급)**

```js

// 파일명이나 이미지 크기로 PSM 자동 결정

const fileName = $json.fileName;

let psm = "3"; // 기본

if (fileName.includes("hand")) {

psm = "13"; // 손글씨 감지

} else if ($binary.data.length < 50000) {

psm = "8"; // 작은 이미지 → 한 단어

}

return [{ json: { psm } }];

```

→ 다음 노드에서 `{{ $json.psm }}` 사용!

---

## **정리표: 언제 어떤 PSM?**

| 문서 유형 | 추천 PSM | n8n 옵션 |

|----------|----------|---------|

| 책, PDF (정상) | `3` | 기본값 |

| 제목, 라벨 | `7` | 한 줄 |

| 브랜드 로고 | `8` | 한 단어 |

| 손글씨 메모 | `13` 또는 `7` | 빠르고 정확 |

| 기울어진 문서 | `1` | 자동 회전 |

| 표, 목록 | `5` | 세로 정렬 |

| 흩어진 텍스트 | `11` | 최대 탐지 |

---

## **테스트 해보기 (직접 해봐!)**

1. **손글씨 사진 준비**

→ "오늘 점심: 김밥, 우동"

2. **n8n 워크플로우에서 PSM 13 설정**

3. **실행 → Slack 확인**

```

손글씨 메모 요약

오늘 점심은 김밥과 우동을 먹을 계획입니다.

_원본 OCR: 오늘 점심: 김밥, 우동_

```

---

## **보너스 팁**

| 팁 | 방법 |

|----|------|

| **정확도 UP** | 이미지 전처리: `Function Node`로 흑백 + 대비 조정 |

| **한국어 손글씨** | `language: kor` + `psm: 13` |

| **영어 손글씨** | `language: eng` + `psm: 8` |

| **혼합 언어** | `kor+eng` + `psm: 7` |

---

## **ELI5 결론**

| PSM은? | → 문서의 **모양 지도**야! |

|--------|-------------------------|

| 손글씨? | → `13` 또는 `7` 지도 써! |

| 책? | → `3` 지도면 충분! |

| 로고? | → `8` 지도! |

---

**다음에 원해?**

- “이미지 전처리 (흑백 + 선명하게)”

- “PSM 자동 선택 워크플로우”

- “Tesseract 대신 EasyOCR로 손글씨 99% 인식”

말만 해! **JSON + 그림 + ELI5**로 바로 줄게!

## **이미지 전처리 기법 상세 설명**

**5살 아이도 이해할 수 있게 (ELI5) + 그림 + n8n 코드 + 실전 예시**

---

### **이미지 전처리란?**

> **"사진을 더 예쁘고 선명하게 만들어서 → OCR이 잘 읽게 해주는 마법!"**

| 비유 | 설명 |

|------|------|

| **안경 닦기** | 흐린 사진 → 선명하게 |

| **색칠 정리** | 복잡한 배경 → 흑백으로 |

| **크기 맞추기** | 너무 작거나 큰 글자 → 딱 맞게 |

---

## **OCR 정확도에 영향을 주는 문제들**

| 문제 | 예시 | 전처리 해결책 |

|------|------|---------------|

| 흐림 | 카메라 흔들림 | **선명도 조정** |

| 배경 복잡 | 신문, 영수증 | **흑백 + 이진화** |

| 글자 작음 | 먼 사진 | **크기 확대** |

| 기울어짐 | 책 옆으로 찍음 | **회전 보정** |

| 노이즈 | 얼룩, 점 | **노이즈 제거** |

---

## **핵심 전처리 기법 6가지 (순서대로!)**

| 순서 | 기법 | ELI5 설명 | 효과 |

|------|------|----------|------|

| 6 | **회전 보정 (Deskew)** | "기울어진 책 바로 세우기!" | 정렬 |

---

## **n8n에서 전처리 구현 (OpenCV 사용!)**

> **n8n은 Python 지원!** → `Function Item` 노드로 **OpenCV** 써서 전처리!

---

### **1. OpenCV 설치 (Docker에 추가)**

```bash

# n8n-ocr 커스텀 이미지 만들기 (한 번만!)

docker run -d --name n8n-ocr \

-p 5678:5678 \

-v ~/.n8n:/home/node/.n8n \

-e N8N_CUSTOM_EXTENSIONS='["n8n-nodes-tesseract"]' \

n8nio/n8n

```

→ **Dockerfile 커스텀** (고급):

```Dockerfile

FROM n8nio/n8n

RUN apk add --no-cache python3 py3-pip tesseract-ocr

RUN pip3 install opencv-python-headless numpy

```

---

### **2. n8n Function Node로 전처리 코드 (복사-붙여넣기!)**

```js

// === 이미지 전처리: OpenCV + Python ===

const cv = require('opencv4nodejs');

const fs = require('fs');

const path = require('path');

for (const item of items) {

const binaryData = item.binary.data;

const filePath = `/tmp/${Date.now()}_${item.json.fileName}`;

// 1. 바이너리 → 파일 저장

fs.writeFileSync(filePath, Buffer.from(binaryData.data, 'base64'));

// 2. OpenCV로 이미지 읽기

let img = cv.imread(filePath);

// 1. 그레이스케일

img = img.bgrToGray();

// 2. 이진화 (Otsu 자동 임계값)

const thresh = cv.threshold(img, 0, 255, cv.THRESH_BINARY + cv.THRESH_OTSU).threshold;

img = thresh;

// 3. 노이즈 제거 (Median Blur)

img = img.medianBlur(3);

// 4. 선명도 조정 (Unsharp Mask)

const blurred = img.gaussianBlur(new cv.Size(0, 0), 1.5);

img = img.addWeighted(img, 1.5, blurred, -0.5, 0);

// 5. 크기 조정 (최소 300 DPI 기준)

const scale = Math.max(1, 2000 / Math.max(img.rows, img.cols));

if (scale > 1) {

img = img.resize(0, 0, scale, scale, cv.INTER_CUBIC);

}

// 6. 회전 보정 (Deskew)

const coords = cv.findNonZero(img);

const rect = cv.minAreaRect(coords);

const angle = rect.angle;

if (Math.abs(angle) > 1) {

const center = new cv.Point2(img.cols / 2, img.rows / 2);

const M = cv.getRotationMatrix2D(center, angle, 1);

img = cv.warpAffine(img, M, new cv.Size(img.cols, img.rows));

}

// 7. 전처리된 이미지 저장

const outputPath = `/tmp/processed_${item.json.fileName}`;

cv.imwrite(outputPath, img);

// 8. 바이너리로 변환 → 다음 노드로 전달

const processedBuffer = fs.readFileSync(outputPath);

const base64 = processedBuffer.toString('base64');

item.binary.processed = {

data: base64,

mimeType: 'image/png',

fileName: `processed_${item.json.fileName}`

};

// 원본은 유지

item.json.processed = true;

}

return items;

```

---

## **전체 워크플로우 흐름 (전처리 포함!)**

```

Gmail → [Function: 전처리] → [Tesseract OCR] → [Ollama 요약] → [Slack]

```

---

## **워크플로우 JSON (복사 → n8n 붙여넣기)**

```json

{

"nodes": [

{

"parameters": {

"labelIds": ["INBOX"],

"downloadAttachments": true

"name": "Gmail Trigger",

"type": "n8n-nodes-base.gmailTrigger",

"position": [240, 300]

{

"parameters": {

"functionCode": "/* 위의 OpenCV 코드 전체 복사 */"

"name": "Image Preprocessing",

"type": "n8n-nodes-base.functionItem",

"position": [460, 300]

{

"parameters": {

"binaryPropertyName": "processed",

"language": "kor+eng",

"options": {

"tessedit_pageseg_mode": "13"

}

"name": "OCR (After Preprocess)",

"type": "n8n-nodes-tesseract.tesseract",

"position": [680, 300]

{

"parameters": {

"operation": "chat",

"model": "llama3.2",

"prompt": "=다음 전처리된 문서 내용을 요약해줘:\n\n{{ $json.text }}"

"name": "Ollama Summarize",

"type": "n8n-nodes-base.ollama",

"position": [900, 300]

{

"parameters": {

"channel": "ai-support",

"text": "전처리 후 요약\n\n{{ $node[\"Ollama Summarize\"].json.output }}\n\n_원본 OCR: {{ $json.text.substring(0, 100) }}..._"

"name": "Slack Send",

"type": "n8n-nodes-base.slack",

"position": [1120, 300]

}

"connections": {

"Gmail Trigger": { "main": [[{ "node": "Image Preprocessing" }]] },

"Image Preprocessing": { "main": [[{ "node": "OCR (After Preprocess)" }]] },

"OCR (After Preprocess)": { "main": [[{ "node": "Ollama Summarize" }]] },

"Ollama Summarize": { "main": [[{ "node": "Slack Send" }]] }

}

```

---

## **전처리 전/후 비교 (실제 예시)**

| 단계 | 이미지 | OCR 결과 | 정확도 |

|------|-------|----------|--------|

| **원본** | 흐리고 배경 복잡 | `안녕하세오 35,000원` | 60% |

---

## **6가지 기법 요약표**

| 기법 | 코드 한 줄 | 효과 |

|------|-----------|------|

| 그레이스케일 | `img.bgrToGray()` | 배경 단순화 |

| 이진화 | `cv.THRESH_OTSU` | 글자만 남김 |

| 노이즈 제거 | `medianBlur(3)` | 얼룩 제거 |

| 선명도 | `addWeighted(1.5, -0.5)` | 글자 선 뚜렷 |

| 크기 확대 | `resize(scale)` | 작은 글자 보정 |

| 회전 보정 | `getRotationMatrix2D` | 기울기 고침 |

---

## **정리: 언제 어떤 전처리?**

| 상황 | 추천 전처리 |

|------|-------------|

| **흐린 사진** | 선명도 + 노이즈 제거 |

| **영수증 (배경 복잡)** | 그레이스케일 + 이진화 |

| **작은 글자** | 크기 확대 |

| **기울어진 책** | 회전 보정 |

| **손글씨** | 전처리 6가지 모두! |

---

## **ELI5 결론**

| 전처리는? | → **OCR의 안경, 화장, 운동화!** |

|-----------|----------------------------------|

| 흐린 사진? | → **닦고, 색칠하고, 키워줘!** |

| 손글씨? | → **6단계 마법으로 95% 인식!** |

---

**다음에 원해?**

- “자동으로 전처리 강도 조절 (AI 판단)”

- “전처리 전/후 이미지 Slack에 같이 보내기”

- “PDF 여러 페이지 → 한 번에 전처리”

말만 해! **코드 + 그림 + ELI5**로 바로 줄게!

n8n기반 AI agent 활용 / n8n 학습 & 사용법

https://claude.ai/chat/0ea596f2-b622-43c8-96ea-2f8db174af88

n8n 학습 & 사용법 🎨

n8n이 뭐예요?

n8n은 레고 블록처럼 서로 다른 앱들을 연결해주는 도구예요!

예를 들어볼까요?

이메일이 오면 → 자동으로 구글 시트에 저장하기
인스타그램에 사진 올리면 → 자동으로 트위터에도 올리기
매일 아침 → 오늘 날씨를 카카오톡으로 받기

이런 일들을 코딩 없이 블록 연결하듯이 할 수 있어요!

시작하기 🚀

1️⃣ n8n 설치하기

가장 쉬운 방법 (클라우드 버전)

n8n.io 웹사이트 방문
무료 계정 만들기
바로 사용 시작!

컴퓨터에 설치하기

npm install n8n -g
n8n start

그러면 브라우저에서 http://localhost:5678 열어요!

기본 개념 🧩

워크플로우 (Workflow)

여러 블록을 연결한 "자동화 레시피"예요!

노드 (Node)

각각의 블록이에요. 종류는:

트리거 노드: 시작 버튼! (예: 이메일이 올 때, 특정 시간마다)
액션 노드: 실제로 일하는 블록! (예: 메시지 보내기, 파일 저장하기)

첫 번째 워크플로우 만들기 🎯

예시: "매일 아침 8시에 할일 목록 메일 받기"

Step 1: 새 워크플로우 만들기

"New Workflow" 버튼 클릭

Step 2: 트리거 추가

➕ 버튼 클릭
"Schedule Trigger" 검색
시간 설정: 매일 오전 8시

Step 3: 할일 가져오기

다음 노드 추가
"Notion" 또는 "Google Sheets" 선택
할일 목록 가져오기 설정

Step 4: 이메일 보내기

"Gmail" 노드 추가
받는 사람: 내 이메일
제목: "오늘의 할일"
내용: 이전 노드에서 가져온 데이터

Step 5: 실행!

"Execute Workflow" 버튼 클릭
테스트해보기

자주 쓰는 노드들 🛠️

트리거 노드

Webhook: 다른 앱에서 데이터 받을 때
Schedule: 정해진 시간에 실행
Email Trigger: 이메일 올 때

유틸리티 노드

IF: 조건 따라 다르게 실행
Set: 데이터 가공하기
Code: 자바스크립트 코드 실행

실전 예시들 💡

예시 1: SNS 자동 포스팅

RSS Feed → IF (새 글 있으면) → Twitter + Facebook 동시 포스팅

예시 2: 고객 문의 자동 정리

Gmail (문의 메일) → Google Sheets 저장 → Slack 알림

예시 3: 데이터 백업

Schedule (매일 밤 12시) → Notion 데이터 → Google Drive 저장

꿀팁! 🍯

작게 시작하세요: 간단한 2-3개 노드부터!
테스트하세요: 각 노드마다 "Execute Node" 눌러서 확인
템플릿 활용: n8n.io/workflows 에서 다른 사람들 워크플로우 복사
에러 처리: Error Workflow 설정해서 문제 생기면 알림 받기
데이터 확인: 각 노드 클릭하면 어떤 데이터 흐르는지 보여요

학습 순서 📚

1주차: 기본 개념 + 간단한 워크플로우 3개 만들기 2주차: IF 노드, 데이터 변환 배우기 3주차: 복잡한 워크플로우, 여러 앱 연결 4주차: 실제로 쓸 자동화 만들기

도움받기 🆘

공식 문서: docs.n8n.io
커뮤니티: community.n8n.io
유튜브: "n8n tutorial" 검색
예시 모음: n8n.io/workflows

기억하세요: n8n은 레고처럼 놀면서 배우는 거예요! 실패해도 괜찮아요. 다시 블록 연결하고, 테스트하고, 재미있게 만들어보세요! 🎉

궁금한 점이나 특정 자동화를 만들고 싶으시면 언제든 물어보세요!

https://mail.google.com/mail/u/0/#inbox/FMfcgzQcqQrWNDgLpZBKzFhhPZtZtSWS

[지리산 ㅡ구달수] [오후 1:17] https://www.heemangfdn.or.kr/layout/res/home.php?go=edu_main.view&num=401&start=0&s_status=&s_year=&s_key1=&s_que=

[지리산 ㅡ구달수] [오후 1:19] https://www.gpters.org/home

[지리산 ㅡ구달수] [오후 1:19] https://app.powerbi.com/view?r=eyJrIjoiZDhjOWVkYjQtZDQ0Mi00MDI4LWI5MDQtMzNiZjAyZTRhZWEyIiwidCI6Ijc2OTVkOTdlLTFmZDQtNDEyMC1hMDk1LWY3NTk5Njc1ZDlkNSIsImMiOjEwfQ%3D%3D

[지리산 ㅡ구달수] [오후 1:20] https://forms.office.com/pages/responsepage.aspx?id=ftmVdtQfIEGglfdZlnXZ1VqBPCJv5D9Mlcqa8eUDdMBUMEVCVklLRjBEQ0Q4RldERlBZNDVGNURDRS4u&route=shorturl

[지리산 ㅡ구달수] [오후 1:36] n8n기반 AI agent 활용 스마트업무 자동화

https://gemini.google.com/app/4f3b9399cb15997a?android-min-version=301356232&ios-min-version=322.0&is_sa=1&campaign_id=gemini_plans_page&utm_source=gemini&utm_medium=referral&utm_campaign=gemini_plans_page&pt=9008&mt=8&ct=gemini_plans_page&hl=ko-KR&_gl=1*k9nwrv*_ga*MTM1NTUzNjI5OS4xNzYyNDAzNTQ3*_ga_WC57KJ50ZZ*czE3NjI0MDM1NDYkbzEkZzEkdDE3NjI0MDM1NjAkajYwJGwwJGgw*_gcl_au*MTI4Nzg0NTQyOS4xNzYyNDAzNTYw

**n8n 학습 & 사용법 (5살도 이해할 수 있게 설명해요! 🧒✨)**

---

### 1. **n8n이 뭐에요?**

👉 **"자동화 레고 상자"** 라고 생각하세요!

- **예시**: "매일 이메일 첨부파일을 구글 드라이브에 저장해야 해" → n8n이 대신 해줘요!

- **장점**: 코딩 없이 **드래그 앤 드롭**으로 작업 연결 가능!

---

### 2. **사용법 3단계 🎯**

**(예: 이메일 → 구글 드라이브 자동 저장)**

#### ① **"시작 블록" 고르기**

- **Gmail** 아이콘 찾기 → "새 이메일 도착" 선택

![](https://n8n.io/nodes/n8n-nodes-base.gmail/)(가상 이미지)

#### ② **"다음 블록" 연결하기**

- **Google Drive** 아이콘 드래그 → "파일 업로드" 선택

- **마법처럼**: 이메일 첨부파일이 자동으로 Drive에 저장!

#### ③ **"실행 버튼" 누르기**

- 전구 모양 **🔘 토글 스위치** 켜기 → 이제 매일 자동으로 작동해요!

---

### 3. **초보자 팁 💡**

- **무료 체험**: [n8n.cloud](https://n8n.io/)에서 바로 시작 가능

- **비밀번호 잊지 않기**: 각 앱 연결시 **API 키**가 필요해요!

신고하기	태그 개조식 모니카 번역기 적격증빙 종합소득세/지출 커서 코딩 클로드 3.5 best 5 기능 클로드 소네트 평어체 프롬프트

startup-7days

2025년 11월 12일 수요일

n8n + OCR 스캔 문서 읽기 완전 가이드 / call n8n workflow tool / 벤토나이트

n8n기반 AI agent 활용 / n8n 학습 & 사용법

n8n 학습 & 사용법 🎨

n8n이 뭐예요?

시작하기 🚀

1️⃣ n8n 설치하기

기본 개념 🧩

워크플로우 (Workflow)

노드 (Node)

첫 번째 워크플로우 만들기 🎯

예시: "매일 아침 8시에 할일 목록 메일 받기"

자주 쓰는 노드들 🛠️

트리거 노드

인기 앱 노드

유틸리티 노드

실전 예시들 💡

예시 1: SNS 자동 포스팅

예시 2: 고객 문의 자동 정리

예시 3: 데이터 백업

꿀팁! 🍯

학습 순서 📚

도움받기 🆘

자동차 전면 유리 제상(Defrost/De-icing) 성능”**을 ANSYS Fluent로 해석 ///

신고하기

태그

구독

2025년 11월 12일 수요일

n8n + **OCR 스캔 문서 읽기** 완전 가이드 / call n8n workflow tool / 벤토나이트

n8n기반 AI agent 활용 / n8n 학습 & 사용법

n8n 학습 & 사용법 🎨

n8n이 뭐예요?

시작하기 🚀

1️⃣ n8n 설치하기

기본 개념 🧩

워크플로우 (Workflow)

노드 (Node)

첫 번째 워크플로우 만들기 🎯

예시: "매일 아침 8시에 할일 목록 메일 받기"

자주 쓰는 노드들 🛠️

트리거 노드

인기 앱 노드

유틸리티 노드

실전 예시들 💡

예시 1: SNS 자동 포스팅

예시 2: 고객 문의 자동 정리

예시 3: 데이터 백업

꿀팁! 🍯

학습 순서 📚

도움받기 🆘

자동차 전면 유리 제상(Defrost/De-icing) 성능”**을 ANSYS Fluent로 해석 ///

n8n + OCR 스캔 문서 읽기 완전 가이드 / call n8n workflow tool / 벤토나이트