# Ollama(올라마) 설치 및 사용법 - Llama 3.2 3B 사용하기
()한글() https://hyunicecream.tistory.com/126
https://hyunicecream.tistory.com/121
https://hyunicecream.tistory.com/121#%EA%B8%B0%EB%8A%A5%20%EB%B0%8F%20%EB%8A%A5%EB%A0%A5-1-6
ollama run <모델 이름> 명령어를 입력하여 로컬 AI 모델을 다운로드하고 실행하는 도구입니다. 설치는 웹사이트에서 운영체제에 맞는 파일을 다운로드하여 진행하며, 실행 후에는 ollama list로 다운로드한 모델을 확인하고, Ctrl + C 등으로 종료할 수 있습니다. - 사이트 접속: 올라마 웹사이트에 접속합니다.
- 다운로드:
다운로드페이지에서 본인의 운영체제(Linux, Mac OS, Windows)에 맞는 설치 파일을 다운로드합니다. - 설치 완료: 다운로드한 파일을 실행하여 설치를 완료합니다.
- 터미널 실행: 설치 후 터미널(명령 프롬프트)을 엽니다.
- 모델 실행:
ollama run <모델 이름>명령어를 입력하여 원하는 모델을 다운로드하고 실행합니다.- 예시:
ollama run llama3(라마 3 모델 다운로드 및 실행)
- 예시:
- Ctrl + C: 모델과 대화 중일 때
Ctrl + C를 누르면 현재 모델 실행이 종료됩니다.
ollama list: 터미널에서ollama list를 입력하면 현재 다운로드된 모델 목록을 확인할 수 있습니다.
Ollama는 대규모 언어 모델(LLM)을 로컬 환경에서 쉽게 실행할 수 있도록 설계된 오픈소스 도구입니다.
모델 구조 및 성능
- 학습 데이터: Llama 3.2는 Llama 3.1보다 더 풍부하고 다양한 데이터로 학습되었습니다. 언어의 뉘앙스, 복잡한 문맥, 문화적 맥락을 더 깊이 이해할 수 있게 되었습니다.
- 모델 아키텍처: Llama 3.2는 더 효율적인 Attention 메커니즘을 도입하여 정보 처리 속도를 향상시켰습니다. 긴 문맥을 처리할 때도 일관성 있고 정확한 결과를 낼 수 있게 되었습니다.
- 파라미터 최적화: Llama 3.2는 더 적은 파라미터로도 Llama 3.1과 유사하거나 더 우수한 성능을 발휘합니다. 모델 실행 시 필요한 자원과 메모리 사용량이 감소했습니다.
기능 및 능력
- 다중 모달 기능: Llama 3.2는 텍스트뿐만 아니라 이미지도 처리할 수 있는 비전 모델(11B 및 90B 파라미터)을 도입했습니다. 이를 통해 차트, 그래프, 이미지 등을 텍스트와 함께 해석할 수 있게 되었습니다.
- 메모리 관리: Llama 3.2는 개선된 메모리 관리 기술로 더 많은 입력 토큰을 동시에 처리할 수 있게 되었습니다. 이로 인해 긴 문장이나 복잡한 문단을 더 원활하게 다룰 수 있습니다.
출처: https://hyunicecream.tistory.com/121#Ollama(올라마)란%3F-1-1 [Café:티스토리]
'생성형 AI/생성형 AI 정보' 카테고리의 다른 글
-
생성형 AI 사용 순위 - 웹, 앱(모바일) 사용자
-
LM Studio 챗봇 사용법 - Llama 3.2-3B 사용 후기
-
생성형 AI Top 50개 서비스 - 웹 버전(사용률 높은 순)
출처: https://hyunicecream.tistory.com/126#요약 질문 답변 - Bllossom%2Fllama-3.2-Korean-Bllossom-3B-1-12 [Café:티스토리]
-멀티패스(Multipath)는 '하나의 신호나 데이터가 둘 이상의 경로를 통해 전달되거나 수신되는 현상'을 의미하며, 통신에서는 전파가 여러 경로로 반사되어 겹쳐지거나(다경로 전파), 컴퓨터 저장 장치에서는 하나의 디스크 볼륨이 여러 경로로 연결되어 인식되는 현상(Multipath I/O)을 지칭합니다. 다경로 전파는 신호 간섭을 일으켜 품질을 저하시키고, Multipath I/O는 시스템의 안정성과 성능을 향상시키는 기술로 사용됩니다.
1. 다경로 전파 (Multipath Propagation)
의미:무선 신호가 건물, 산, 수역 등 다양한 지형지물에 반사되어 수신 안테나에 둘 이상의 다른 시간과 경로를 통해 도달하는 현상입니다.
원인:대기 덕트, 전리권 반사, 굴절, 지상 물체로부터의 반사 등이 있습니다.
영향:빨리 도달한 신호와 늦게 도달한 신호가 합쳐지면서 수신 신호가 강해지거나 약해지는 간섭 현상(다중 경로 효과)을 일으킵니다.
2. 멀티패스 입출력 (Multipath I/O, MPIO)
의미:스토리지 환경에서 하나의 저장 장치(볼륨)에 대해 서버가 여러 물리적 경로(패스)를 통해 동시에 접속할 수 있도록 하는 기술입니다.
목적:두 개 이상의 물리적 경로를 정의하여, 특정 경로가 끊기더라도 다른 경로를 통해 데이터에 접근할 수 있게 하여 내결함성(fault tolerance)을 확보하고 성능을 향상시킵니다.
동작:운영체제에서 하나의 저장 장치가 여러 개로 인식되는 상황을 하나의 논리적 볼륨으로 묶어주는 역할을 합니다.
기술:
# 올라 마 사용법 https://hyunicecream.tistory.com/121
# 그라디오-Gradio는 누구나 어디서나 사용할 수 있도록 친숙한 웹 인터페이스를 통해 머신 러닝 모델을 가장 빠르게 데모할 수 있는 방법
Gradio는 Model을 웹으로 손쉽게 사용할 수 있게 해주는 라이브러리이자 플랫폼입니다.
각종 UI를 쉽게 그릴 수 있게 해주고, input을 받아 서버에서 inference 혹은 predict를 한 후 그 결과를 사용자들에게 돌려줍니다.
다른 웹 어플리케이션 서버들과 차별화된 점은 ML 모델이 자주 다루는 컴포넌트들이 이미 이쁜 UI로 구현이 돼 있다는 점이죠.
복잡한 커스터마이징은 어렵지만, 오디오, 비디오, 챗봇, 이미지, 텍스트, 확률 표시 등 머신러닝에서 자주 사용하는 기능들을 거의 코딩 없이 제공가능합니다.
출처: https://lifeignite.tistory.com/63 [Lifeignite:티스토리]
댓글 없음:
댓글 쓰기