AI engineering/LLM (4) 썸네일형 리스트형 [LLM] 딥시크란? 맥북으로 딥시크 간단하게 돌려보기 요즘 핫한 LLM 딥시크, 적은 비용으로 챗지피티 성능을 따라잡았다고 하는데요.딥시크는 중국의 인공지능 회사가 개발한 오픈소스 LLM 모델로,적은 비용, 오픈된 코드, 높은 성능을 키워드로 여러 빅테크 기업들에 충격을 안겨줬죠. 딥시크에는 크게 두 가지 모델이 있어요.V3와 R1입니다.V3: 자연어 처리를 위해 개발한 LLMR1: V3을 기반으로 좀 더 복잡한 추론(코딩, 수학 풀이 등)을 위해 개발하지만 개발 회사가 중국이라는 사실에 개인정보 유출과 보안 취약점에 대한 우려가 커졌는데요,저도 웹에서 돌려보기는 찝찝하더라구요. 그래서 개인적으로 궁금하여 R1을 맥북에서 돌려봤습니다.제 맥북 사양은 512G, 48G RAM이었어요.상세 과정과 결과를 보여드릴게요.OLLAMA 설치https://ollama.. 이 ChatGPT는 스스로 마인크래프트를 합니다. - LLM, AI agent AI 엔지니어 직무를 새로 맡게 되어 AI agent에 대한 공부를 하고 있습니다.알아보니 이 agent가 참 흥미로운 것들이 많더군요.더 늦게 알았다면 아쉬울 뻔했습니다. 게임도 AI agent가 대신 해주는 시대입니다.이 GPT는 스스로 집을 짓고, 사냥하고, 갑옷 재료를 만들어 입습니다.인간의 개입없이 말이지요.광범위한 기술을 습득하고, 지속적으로 새로운 발견을 합니다. 어떻게 이런 동작이 가능한 것일까요?역시 딥러닝의 강화 학습(RL)과 모방 학습을 사용했습니다. voyager에는 세 가지 핵심 모듈이 존재합니다.탐험을 극대화하는 자동 커리큘럼복잡한 행동을 저장하고 검색하기 위한 스킬 라이브러리임베디드 제어를 위한 실행 가능한 코드를 생성하는 새로운 반복적 프롬프트 메커니즘 프롬프트들과 컨텍스트 .. [LLM] ChatGPT, Claude, Gemini 같은 LLM이란? 초보도 쉽게 알기 요즘 같은 AI 시대에 ChatGPT를 한 번쯤은 들어봤을 것 같은데요,조금만 더 깊게 들어가면 LLM이라는 개념이 나옵니다.그렇다면 LLM은 무엇일까요? Large Language Model, 즉 LLM이란,대규모 언어 모델의 약자로 방대한 양의 데이터로 사전 학습된 딥러닝 모델입니다. 하지만 이런 LLM이 하나만 있는 것이 아니지요. Chatbot Arena에서 확인할 수 있듯이 이미 ChatGPT-4o(최신 버전)의 성능을 뛰어넘은 모델들도 있습니다. LLM의 동작방식1. LLM은 방대한 양의 텍스트 데이터를 사전학습 합니다.LLM은 기본적으로 파일 2개로 이루어져 있습니다.매개변수 파일과 C 혹은 파이썬으로 작성된 실행 파일입니다.실행 파일은 대부분 500줄의 코드로 작성됩니다.이 파일을 실행하게.. [LLM, RAG] 테이블 데이터를 LLM 프롬프팅에 사용하기 LLM 모델을 사용하여 다양한 형식의 표 데이터를 어떻게 사용할 수 있을까? 투자 회사에서 일하는 재무 분석가를 생각해보자. 당신의 업무는 잠재적인 투자 기회를 파악하는 것이다. 검색 증강 생성(RAG) 시스템을 사용하여 시장 동향, 투자 기회, 경제적 위험을 쉽고 빠르게 파악하고 "어느 산업에 억만장자가 가장 많을까?" 또는 "다른 지역에서 억만장자의 나이 분포는 어떻게 비교될까?" 같은 질문에 답하는 것을 고려할 수 있다. 첫 번째 단계는 해당 정보를 얻기 위해 출처로 가는 것이다. 하지만 문서에는 텍스트 뿐만 아니라 표도 포함되어 있다. LLM과 구조화된 데이터의 과제인간에게는 텍스트와 표 사이의 연결점을 생각해내는 것이 간단하지만, LLM에게는 그렇지 않다.LLM은 순차적으로 텍스트 처리를 하도록.. 이전 1 다음