2025년 9월 3일 수요일

9.03 - 머신러닝 및 딥러닝 -텍스트 생성형 AI- 멀티모달 생성형 AI- 코드 생성형 AI- 데이터 생성형 AI

 머신러닝 및 딥러닝 -



텍스트 생성형 AI


- 텍스트를 생성하거나 요약, 번역, 질문 응답 등 다양한 언어 작업을 수행

- 글, 스크립트, 요약, 번역, 대화 등 텍스트 기반 콘텐츠 생성

- 뉴스 기사, 블로그 포스트, 에세이, 소설, 시 등 다양한 장르의 글을 만듦.

- 최근 대규모 언어 모델(예: GPT 계열, LLaMA, PaLM 등)의 발전으로 문맥 유지, 논리적 전개, 특정

문체 모방 등이 크게 개선

- 활용 분야: 문서 작성, 소설 생성, 코드 생성, 번역, 채팅봇, 요약 등


대표 모델 및 도구 모델 및 도구 특징 제작사


GPT 시리즈

(Generative Pre-trained Transformer)


대화, 스토리 생성, 텍스트 작성

예) GPT-3, GPT-3.5, GPT-4o, GPT-5


OpenAI

Gemini 대화 및 멀티모달 이해 Google DeepMind

Claude 대화와 텍스트 생성 Anthropic

LLaMA(Large Language Model Meta AI) 효율적 대규모 언어 모델 Meta

BERT/DistilBERT 자연어 이해 및 처리 Google

BERT 문장 및 문맥 이해 Google

T5 (Text-to-Text Transfer Transformer) 텍스트 변환 및 생성 Google




5. 멀티모달 생성형 AI


- 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 형식을 통합적으로 생성

- 활용 분야: 멀티모달 챗봇, 이미지 설명, 콘텐츠 생성 보조


대표 모델 및 도구 모델 및 도구 특징 제작사


GPT-4 텍스트와 이미지 모두 이해하고 생성 OpenAI

Gemini 멀티모달 AI 개발 프로젝트 Google DeepMind

CLIP 텍스트-이미지 이해 OpenAI

Flamingo 이미지 사전 훈련이 잘되어 있음. DeepMind

특징


6. 코드 생성형 AI


- 코드 작성, 오류 수정, 소프트웨어

설계 지원

- 활용 분야: 소프트웨어 개발, 코드

자동 완성, 오류 수정, 프로그래밍

학습 보조


대표 모델 및

도구


모델 및 도구

특징 제작사

GitHub Copilot 코딩 보조 도구 OpenAI와  GitHub 협업

TabNine 코드 자동 완성 TabNine

Replit Ghostwriter 코드 작성 및 디버깅


Replit


AlphaCode 코드 생성 및 문제


해결 DeepMind

CodeGen 코드 생성 Salesforce

starCoder 코드 생성 및 자동완성


BigCode 프로젝트특징

4일 전 — GitHub Copilot은 GitHub가 2021년 출시한 자동 코드 완성 인공지능이다. 주석이나 함수 이름에 담긴 의미를 파악하여 코드를 자동 완성해, 단순하고 ...
GitHub is where people build software. More than 150 million people use GitHub to discover, fork, and contribute to over 420 million projects.
관련 질문


7. 데이터 생성형 AI


- 데이터 시뮬레이션, 테스트 데이터

생성, 데이터 강화


대표 모델 및 도구


모델 및 도구

특징 제작사


Gretel.ai 합성 데이터 생성

Mostly AI 개인정보 보호 합

성 데이터 생성

Datagen 컴퓨터 비전용 시

뮬레이션 데이터


1. 코드 생성형 AI 플랫폼


플랫폼명 특징


GitHub Copilot(OpenAI Codex)


- Github와 OpenAI가 공동 개발한 인공지능 기반 코드 작성 도구

- NeoVim, VSCode, Visual Studio, JetBrains 계열 모든 IDE에서 사용 가능

- C++, Python, Go, JS/TS Ruby, Swift, Java, Kotlin, Rust, PHP 등 다양한 언어

를 지원

- 코드 자동 완성: 함수나 변수를 만들면 관련된 코드를 자동으로 제안

- 주석을 작성하면 해당 설명에 맞는 코드 생성

- 언어간 전환 기능, 코드 수정 기능(리팩토링, 오류 수정), 코드 설명 등


TabNine


- 머싱러닝 알고리즘으로 자동으로 소스 생성해주거나 코드 완성을 지원하는

AI 완성 도구

- VSCode 플러그인 형태로 제공


Replit Ghostwriter


- 무료 브라우저 기반 IDE (설치x, 인터넷 연결된 환경에서 언제든 사용)

- AI 코딩 보조 도구

- Python, JavaScript, Java, C++ 등 다양한 언어 지원

- 코드 생성 기능(이전의 주석이나 코드 없이도 전체 코드를 생성할 수 있는

기능 제공/원하는 내용 입력하면 코드를 자동으로 생성)

- 코드 설명 기능, 코드 변환 기능 등


2. UI·UX 생성형 AI 플랫폼


플랫폼명 특징


Galileo AI - 무료 150 크레딧 제공(한번 생성 시 20개 차감)


- 텍스트 또는 이미지를 바탕으로 UI 프로토타입을 제작 / Figma와 연동 가능


Uizard - 웹사이트, 모바일 및 웹 앱, 데스크톱 소프트웨어를 쉽게 디자인할 수 있는


직관적인 AI 도구


Dora AI


- 무료: 120크레딧 제공(10개의 AI미리보기, 5개의 AI 페이지 생성 가능)

- Figma 플러그인으로 사용가능


Creatie.ai


- 프로토타입 제작, 디자인, 애플리케이션 배포를 원활하게 수행할 수 있도록

직관적이고 효율적인 솔루션을 제공

- HTML, React, Vue 등 코드 생성


Figma AI


- 생성된 결과물은 완성본이라기보단 초안(시작점) 역할

- 자동 디자인 생성, 디자인 제안 및 리디자인, 카피라이팅 지원(텍스트 생성),

코드 스니펫 추천(생성한 UI에 대해 HTML./CSS 코드 스니펫 제공)


Fronty


- 이미지 디자인을 운영 웹사이트로 변환

- 사용자 지정 HTML, CSS 및 React 코드를 생성


3. 이미지 생성형 AI 플랫폼


플랫폼명 특징


Adobe Firefly - 처음 25 크레딧 무료 사용 후 유료 전환


- 웹 애플리케이션 형태로 별도의 설치 없이 브라우저에서 바로 사용


DALL-E


- OpenAI에서 개발한 이미지 생성 AI모델

- 텍스트 설명을 기반으로 이미지를 생성하는 도구


Canva

- 소셜미디어 게시물, 포스터, 브로셔, 프레젠테이션 등을 쉽게 제작

[텍스트→이미지 전환 AI]

- 무료: 1개월 당 20회 사용 가능 / Pro이상: 매달 500회 가능


Midjourney(미드저니)

- 별도의 디스코드 계정을 만들고 명령 구문을 사용할 줄 알아야 그림을 생성할 수 있음


Designs.ai - 가장 포괄적인 AI 그래픽 디자인 도구 중 하나

- AI채팅, 이미지 메이커, AI작가, 로고, 디자인 메이커, 이미지→텍스트 변환 등


Autodraw

- Google에서 제작

- 자신의 그림을 기반으로 아이콘과 요소를 만들 수 있음

- 선 하나만 그려도 아이콘 추천


3. 이미지 생성형 AI 플랫폼


플랫폼명                                                   특징


Microsoft Bing - Image Creater - 한글 지원 / 무료 / 음성,이미지 검색 가능 / 하나의 크기로만 제작가능


Napkin AI

- 사용자가 입력한 텍스트를 분석하여 관련된 시각 자료를 자동으로 생성

- 다양한 시각화 옵션(플로우 차트, 마인드맵, 인포그래픽 등)

- 프레젠테이션이나 문서에 들어갈 시각 자료를 빠르게 생성하여 발표의 효과를 높일 수 있음


MyEdit - 매일 3 크레딧 제공 / 한국어 지원 / 다양한 내장 AI 아트 프리셋

- 그림 생성 후 커스터마이징 불가능


sora

- 텍스트 입력만으로 최대 1분 길이의 고품질 비디오 생성

- 텍스트 뿐만 아니라 이미지나 비디오를 입력으로 받아 기존 콘텐츠를 확장하거나 편집할 수 있음


4. 비디오 생성형 AI 플랫폼


플랫폼명 특징


AI 이름 특징 (Key Features) 장점 (Pros) 단점 (Cons) 버전 (Versions/Models) 비용 (Costs)


ChatGPT

(OpenAI)


대화, 코드 생성, 데이터 분석, 이미지 생

성, 음성 모드 지원. 파일 업로드, 비전(이

미지 분석), 캔버스(편집 도구), 깊이 있는

연구 기능.

웹/모바일 앱 지원, 팀 협업 기능

(Team/Enterprise). 멀티모달(텍스트, 이미지, 음성) 처리.


다재다능하고 사용자 친화적.

대규모 지식 베이스와 창의적 응답.

생산성 향상(예: 콘텐츠 작성, 코딩 지원).

무료 버전으로 쉽게 접근 가능.


환각(hallucination) 발생 가능.

실시간 정보 제한(검색 기능은 유료).

무료 버전 사용 제한(예: 모델 액세스 한정).

프라이버시 우려.

Pdf 문서 처리에서 제약 많음.


GPT-5 (기본), GPT-5 Thinking,

GPT-5 Pro.

이전 버전: GPT-4o, GPT-4.1, o3시리즈.

무료: 제한적 GPT-5 액세스.

유료: 고급 모델 무제한.


무료: 기본 기능.

Plus: $20/월 (확장 제한, 음성모드).

Pro: $200/월 (최고 액세스, 조기기능).

Team: $25/유저/월 (연간 청구,최소 1명).

Enterprise: 맞춤 가격 (문의 필요).


Grok (xAI)

지능형 대화, 코딩 지원, 추론, 음성 모드. 실시간 X(트위터) 데이터 검색(트렌드, 사용자 감정 분석). 문서 요약, 이미지 생성(텍스트 기반).

유머러스하고 정치적으로 중립적 응답.

웹/앱(X iOS/Android) 지원.


실시간 정보 강점(X 데이터 활용).

유머와 솔직한 응답(검열 적음).

코딩 및 깊이 있는 분석 우수. 이미지 생성과 음성 대화 자연스러움.

정치, 의학 분야등 범용적 가능.

Pdf 문서 처리가 강력함.

특정 분야에 제약을 두지 않으며 개인정보 부분도 허용.


X 플랫폼 의존적(접근 제한).

일부 기능 SuperGrok 한정. 다른AI만큼 광범위한 통합 부족.

개인 정보 관련 부분도 허용.


Grok 4 (기본, SuperGrok).

Grok 4 Heavy (어려운 작업).

Grok Heavy (최강 버전, SuperGrok Heavy).

Grok 3 (무료 제한적).


Grok 3: 무료 (사용량 제한,grok.com/X 앱).

SuperGrok(Grok4) : 30$

SuperGrok Heavy : 300$


Gemini(Google)

멀티모달(텍스트, 이미지, 비디오, 코드)처리.

Google 앱 통합(검색, Gmail, Docs 등).

코드 생성, 데이터 시각화, 웹 검색 내장.

iOS/Android 앱 지원, 음성/이미지 입력.


Google 생태계 통합 강점.

실시간 웹 검색과 정확성 높음.

멀티모달 기능(이미지/비디오 분석) 우수. 비용 효과적.


프라이버시 문제(Google 데이터사용).

창의성에서 ChatGPT에 밀림.일부 기능 지역 제한. 응답 속도느림.


Gemini 2.5 Pro (고급).

Gemini Nano (경량, 모바일).

이전: Gemini 1.5, Ultra.


무료: 기본 기능.

Advanced: $20/월 (Google One AI Premium 포함, 무제한 액세스).

Business/Enterprise: 맞춤 가격(문의).


5. 생성형 AI 비교자료

AI 이름 특징 (Key Features) 장점 (Pros) 단점 (Cons) 버전 (Versions/Models) 비용 (Costs)

Copilot(Microsoft)


콘텐츠 작성, 인사이트 제공, 작업 자동화.

Microsoft 365 통합(Word, Excel, Teams

등). 웹 검색, 이미지 생성, 코드 지원.

보안/프라이버시 강조, GitHub Copilot(코딩 특화).


MS Office 통합으로 생산성 높음.

엔터프라이즈 보안 강점. 무료 버전 광범위.실시간 웹 검색.응답 속도 느림.창의적 작업 약함.

MS 생태계 의존.일부 기능 라이선스 필요.

Copilot (기본, GPT 기반).

Copilot 365 (비즈니스).

Security Copilot (보안 특화).

GitHub Copilot (코딩).


무료: 기본 웹/앱.

Pro: $20/월 (무제한, 파일 업로드).

365 Copilot: $30/유저/월 (M365 플랜 필요).

Enterprise: 맞춤.


Claude AI(Anthropic)


코드 생성, 데이터 시각화, 텍스트/이미지분석. 웹 검색, 프로젝트 관리, Google

Workspace 통합. 긴 컨텍스트 윈도우, 윤리적 AI 강조. 데스크톱 확장, 터미널 코드 액세스.


복잡한 작업(코딩, 연구) 최적.윤리적/안전 설계.긴 컨텍스트 처리 우수.배치 처리 비용 절감(50%).


메시지 제한(Pro에서도).이미지 생성 미지원.속도에서 Haiku 제외 느림.무료 버전 제한적.


Claude Opus 4.1 (복잡 작업).

Claude Sonnet 4 (균형).

Claude Haiku 3.5 (빠름).

레거시: Opus 3/4, Sonnet 3.7.


무료: 기본.

Pro: $20/월 ($17 연간).

Max: $100/인/월.

Team: $30/유저/월 (표준, 최소5명).

Enterprise: 맞춤.


Perplexity.ai

검색 중심 AI(실시간 웹 검색, 인용 제공).

이미지 업로드, 코드 생성, 데이터 분석.

빠른 응답, 주제 탐색(Threads).

멀티모달 지원.


사실 기반 응답(인용 포함).

연구/학습에 최적.

무료 버전 강력.

속도 빠름.


창의적 대화 약함.

복잡한 작업 제한.

무료 버전 쿼리 제한.

검색 의존적.


자체 모델 + 외부(예: GPT,Claude 통합).

Pro: 고급 모델 액세스.


무료: 제한적.

Pro: $20/월 (무제한 검색, 이미지 업로드).

Enterprise: 맞춤.

댓글 없음:

2.06 -