2025년 6월 23일 월요일

텍스트 추출 / 드래그 프리 설치 및 사용법

 

드래그프리(마우스 드래그 & 마우스 우클릭 해제 & 글자수 세기)

이 앱은 마우스 드래그나 마우스 우클릭이 방지되어 있는 사이트에서 해당 기능을 가능하게 해주는 앱입니다.(글자수를 세는 기능이 추가되었습니다.)
2024. 3. 12. — Chrome에 추가를 눌러주시고 확장프로그램 설치 버튼 눌러주시면 확장프로그램이 자동으로 추가됩니다! 설치가되면 첫번째 사진처럼 드래그프리가 추가된 ...
2024. 7. 31. — 이 앱은 마우스 드래그나 마우스 우클릭이 방지되어 있는 사이트에서 해당 기능을 가능하게 해주는 앱입니다.(글자수를 세는 기능이 추가되었습니다.).
2021. 2. 10. — 이 앱은 마우스 드래그나 마우스 우클릭이 방지되어 있는 사이트에서 해당 기능을 가능하게 해주는 앱입니다. chrome.google.com. 설치를 ...
2024. 9. 2. — 드래그프리는 프로그램은 아닙니다. 확장 프로그램 형태이고요. 때문에 크롬 브라우저를 통해서 설치하시고 사용하시면 됩니다. 우선, 아래 링크를 통해 ...



영상에서 오디오를 추출했습니다. 다음 단계로는 음성에서 텍스트를 인식(음성 인식)하여 자막 형태로 변환하겠습니다. 계속 진행하겠습니다.

현재 환경에서는 음성 인식 라이브러리(speech_recognition)가 지원되지 않아 텍스트 추출을 직접 수행할 수 없습니다.

대신 아래 두 가지 방법 중 하나를 선택하실 수 있습니다:


✅ 방법 1: 음성 인식 가능한 로컬 소프트웨어 사용

  1. 구글 Docs 음성 입력 (Chrome 브라우저 필요)

    • Google Docs > 도구 > 음성 입력

    • 추출한 오디오 파일을 재생하면 실시간으로 텍스트를 입력해줍니다.

  2. VLC + Whisper + Python 조합 사용 (고급 사용자용)

    • Whisper(OpenAI 음성 인식 모델)를 로컬에서 실행하여 정확한 한글 음성 인식이 가능합니다.


✅ 방법 2: Whisper를 이용한 자동 처리 (제가 해드릴 수 있음)

Whisper 기반 음성 인식 처리를 통해 자동으로 텍스트를 추출해드릴 수 있습니다. 이를 위해 지금 Whisper 엔진을 사용해 처리해드릴게요. 잠시만 기다려 주세요.

현재 환경에서는 Whisper 음성 인식 엔진도 사용할 수 없습니다. 대신, 아래 방법 중 하나를 제안드립니다:


🔧 해결 방법

✅ 방법 1: Whisper Web 서비스

  • 무료이며 간단히 .mp4 또는 .wav 업로드로 한글 자막을 추출할 수 있습니다.

✅ 방법 2: 제가 텍스트만 추출된 음성 내용을 제공해드리길 원하시면:

  • 영상을 프레임별 이미지로 추출한 뒤, OCR(문자인식)을 활용하여 화면 내 텍스트를 추출해드릴 수 있습니다.

  • 이 방법은 영상 내 음성이 아닌 화면에 보이는 글자를 인식합니다.

진행할 방향을 선택해 주세요:

  1. [권장] Whisper 기반 웹사이트를 이용해 직접 텍스트 추출

  2. 영상 속 화면 내 텍스트를 이미지 분석(OCR) 방식으로 추출

어느 방법을 원하시나요?

영상에서 화면 내 텍스트를 추출하는 도중 시스템 오류로 인해 중단되었습니다. 다시 시도해서 문제를 해결하겠습니다. 잠시만 기다려 주세요.

프레임 이미지에서 텍스트를 추출하는 과정이 다시 실패했습니다. 이는 처리 중 환경이 강제로 초기화되면서 발생한 문제입니다.

해결을 위한 제안

✅ 최종 대안: 영상에서 텍스트 추출을 위한 파일 다운로드 제공

제가 지금까지 진행한 결과로:

  • 영상 전체에서 1초 간격으로 프레임을 추출하고,

  • 각 프레임에서 텍스트를 인식하는 구조를 구성했습니다.

이 과정을 로컬에서 직접 실행할 수 있는 Python 스크립트로 드릴 수 있습니다.


🔽 다운로드용 Python 스크립트 포함 Zip 파일 제공

아래 포함 내용을 zip 파일로 제공해드릴 수 있습니다:

  • 영상 프레임 추출 코드

  • Tesseract OCR 적용 코드

  • 결과 저장 코드 (txt 또는 csv)

  • 실행 가이드 (README 포함)


진행해드릴까요?
✔️ “네”라고 하시면 다운로드 가능한 zip 파일을 생성해드리겠습니다.

아래 링크에서 영상의 화면 텍스트를 추출할 수 있는 Python 스크립트와 사용 가이드를 포함한 ZIP 파일을 다운로드하실 수 있습니다:

👉 video_ocr_extractor.zip 다운로드

구성 파일:

  • extract_ocr_from_video.py: 영상에서 프레임을 추출하고 OCR 처리하는 파이썬 스크립트

  • README.txt: 설치 방법 및 사용법 안내

영상 파일 이름은 반드시 video.mp4로 저장하여 같은 폴더에서 실행해 주세요. 필요시 추가적인 자동화나 정제도 도와드릴 수 있습니다.


올려주신 Python 코드에서는 영상(video.mp4)을 불러와 1초 간격으로 프레임을 추출한 후, 각 프레임에 대해 OCR(문자인식)을 수행하여 텍스트를 ocr_result.txt 파일로 저장하는 작업을 수행합니다.

해당 코드를 실행하셨다면, 텍스트 결과는 현재 디렉토리에 ocr_result.txt로 저장되어 있을 것입니다.


✅ 코드의 핵심 요약 및 기능

단계 기능 설명
1. 경로 설정 "video.mp4" 파일과 frames 폴더 생성
2. 프레임 추출 영상에서 1초마다 이미지 프레임 저장
3. OCR 실행 각 프레임 이미지에서 텍스트 추출
4. 결과 저장 텍스트를 ocr_result.txt에 저장

📄 예시 결과 형식 (ocr_result.txt)

[frame_0000.png]
오늘은 OCR을 테스트하는 예시입니다.

[frame_0001.png]
이 텍스트는 영상 속 이미지로부터 인식되었습니다.

🔍 결과 확인 방법

  1. ocr_result.txt 파일을 열어보세요.

  2. 텍스트가 없거나 부정확할 경우:

    • 영상에 있는 글자가 너무 작거나 흐릿할 수 있습니다.

    • gray = cv2.cvtColor(...) 이후 cv2.threshold() 또는 cv2.GaussianBlur() 등을 추가하면 정확도가 향상될 수 있습니다.

필요하다면 텍스트 정제, 불필요한 반복 제거, 키워드 요약 등의 후처리도 도와드릴 수 있습니다. 결과 파일을 공유해 주시겠어요?


현재까지 사용자가 업로드한 파일은 다음 두 개입니다:

  • extract_ocr_from_video.py

  • README.txt

하지만, ocr_result.txt 파일은 아직 업로드되지 않았습니다. 이 파일은 OCR 결과가 저장된 텍스트 파일이며, 사용자가 로컬에서 Python 스크립트를 실행한 후 생성되었을 가능성이 큽니다.


🔍 파일을 찾는 방법 (로컬 PC 기준)

  1. 스크립트를 실행한 폴더를 열어보세요.

    • extract_ocr_from_video.py와 같은 위치에 있어야 합니다.

  2. ocr_result.txt라는 이름의 텍스트 파일이 있는지 확인하세요.

  3. 파일이 있다면, 이 대화창에 파일을 드래그하거나 ‘파일 업로드’ 버튼으로 업로드해 주세요.


업로드만 해주시면, 다음 작업으로:

  • 📑 텍스트 정제

  • 📌 핵심 요약

  • 📊 키워드 통계

를 바로 처리해드리겠습니다.
🔁 파일 업로드를 기다리고 있겠습니다!

댓글 없음:

자동차 전면 유리 제상(Defrost/De-icing) 성능”**을 ANSYS Fluent로 해석 ///

도움말  좋은 화면 캡처예요 👍 이 이미지는 ANSYS Fluent → Setup 단계의 General 화면 이고, **“해석의 뼈대(종류·시간·좌표계)를 결정하는 곳”**입니다. 아래에서 화면에 보이는 기능을 영역별로 정확히 설명할게요. 🔧 ...