본문 바로가기

AI engineering

(11)
심층 리서치 구현: OpenAI Agent SDK를 활용해서 Deep Research Agent 만들기 이번 글에서는 OpenAI의 Agent SDK를 이용해 복잡한 질문에 대한 깊이 있는 답변을 제공하는 Deep Research Agent를 구현하는 과정에 대해 설명합니다. Deep Research란? 여러 단계의 정보 검색과 추론을 반복적으로 수행하여 보다 심층적이고 복합적인 질문에 대한 종합적인 답변을 생성하는 프로세스를 의미합니다. 이전 글(전통 RAG의 한계와 ReAct 기반 Tool-Using 에이전트)에서 "ReAct: Synergizing Reasoning and Acting in Language Models"의 개념에 대해 소개해드렸는데요, 이 논문은 언어 모델이 추론(reasoning)과 행동(acting)을 반복적으로 수행하여 복잡한 문제를 해결하는 방법론을 제시하고 있습니다. 참고: ..
전통 RAG의 한계와 ReAct 기반 Tool-Using 에이전트로 멀티홉 추론 해결하기 전통 RAG의 한계 (Retrieval-Augmented Generation의 한계)RAG(Retrieval-Augmented Generation)는 대형 언어 모델(LLM)이 응답을 생성할 때, 외부 지식베이스에서 관련 정보를 검색하여 활용하는 기법입니다. 예를 들어 질문에 답하기 위해 벡터 DB 등에서 관련 문서를 찾아와 LLM의 프롬프트에 포함시키는 방식이죠. 이러한 전통적인 RAG 파이프라인은 질문 → 키워드 기반 벡터 검색 → 상위 문서 반환 → 답변 생성의 단순 구조로 이루어집니다. 하지만 이 방식에는 큰 한계가 있습니다. 질문 자체가 여러 단계를 거쳐야 풀리는 경우(멀티홉 추론)에는 한 번의 벡터 검색으로는 충분한 정보를 얻기 어렵습니다 (genui.com). 다시 말해, 질문에 필요한 단서..
Cursor보다 좋고 싸다: Mac에서 Gemini CLI 사용하기 설치 및 실행 방법설치 방법은 매우 간단합니다.터미널에서 아래 코드를 실행하면 설치부터 실행까지 한 번에 됩니다.npm install -g @google/gemini-cligemini 만약 npm이 없다면 먼저 노드를 설치하고 다시 위 명령어를 실행합니다.brew install node 권한 부여디스크 접근 권한이 없으면 파일을 읽을 때 못 찾겠다, 읽을 수 없다 등 헛소리를 하게 되니설정 > 전체 디스크 접근 권한에서 gemini를 실행하는 터미널, iTerm에 권한을 부여해 주세요.실행 방법처음 실행을 하게 되면 Google Login, API Key 입력 등 다양한 인증 방법이 나옵니다.저는 그냥 구글 계정으로 인증했습니다. 또 웹앱 개발 등 cursor처럼 특정 목적으로 해당 폴더에 들어가서 g..
강화학습 쉽게 이해하기: 강화학습 개념과 벨만 방정식 강화학습이란?강화학습(Reinforcement Learning)은 스스로 행동하면서 보상을 최대화하는 방법을 배우는 알고리즘입니다.딥러닝이나 지도학습처럼 ‘정답’(라벨링 등)을 주지 않고, 행동 → 결과 → 보상만으로 학습합니다.주요 구성 요소Agent(행위자): 학습을 수행하는 주체 (예: 로봇 청소기, 게임 캐릭터)Environment(환경): 에이전트가 상호작용하는 세계State(상태): 현재 상황 정보Action(행동): 선택 가능한 움직임Reward(보상): 행동의 즉각적인 피드백강화학습 예시 - 미로를 탈출하는 로봇 청소기로봇 청소기가 미로를 탈출한다고 가정해봅시다.에이전트: 로봇 청소기환경: 미로상태: 현재 위치행동: 상하좌우 이동보상: 출구에 가까워지면 +1, 막다른 길이면 -1로봇은 수없..
[LLM] 딥시크란? 맥북으로 딥시크 간단하게 돌려보기 요즘 핫한 LLM 딥시크, 적은 비용으로 챗지피티 성능을 따라잡았다고 하는데요.딥시크는 중국의 인공지능 회사가 개발한 오픈소스 LLM 모델로,적은 비용, 오픈된 코드, 높은 성능을 키워드로 여러 빅테크 기업들에 충격을 안겨줬죠.  딥시크에는 크게 두 가지 모델이 있어요.V3와 R1입니다.V3: 자연어 처리를 위해 개발한 LLMR1: V3을 기반으로 좀 더 복잡한 추론(코딩, 수학 풀이 등)을 위해 개발하지만 개발 회사가 중국이라는 사실에 개인정보 유출과 보안 취약점에 대한 우려가 커졌는데요,저도 웹에서 돌려보기는 찝찝하더라구요. 그래서 개인적으로 궁금하여 R1을 맥북에서 돌려봤습니다.제 맥북 사양은 512G, 48G RAM이었어요.상세 과정과 결과를 보여드릴게요.OLLAMA 설치https://ollama..
노코딩으로 초간단 chatGPT 창작 작문 AI 에이전트 만들기 - FlowiseAI 이번 글에서는 FlowiseAI로 chatGPT를 이용한 초간단 AI 에이전트를 만들어 보겠습니다.목표는 어린이용 동물 이야기를 작성해주고 제목도 만들어주는 스토리텔러 에이전트입니다.물론 chatGPT도 할 수 있지만 특화된 에이전트는 더욱 잘 만들 수 있을 겁니다.매우 간단하니 끝까지 봐주세요. 0. 사전 준비: FlowistAI 설치2025.01.01 - [AI engineering/AI agent] - FlowiseAI 설치방법: 코딩 없이 쉽게 나만의 챗봇, 추천 시스템을 만드는 툴 FlowiseAI 설치방법: 코딩 없이 쉽게 나만의 챗봇, 추천 시스템을 만드는 툴FlowiseAI란?FlowiseAI는 오픈소스 비주얼 노코드(Visual No-code) 도구로, LangChain 프레임워크를 기반..
AI 분야 입문자를 위한 추천 학습 로드맵 (2025 버전, 추천 강의 포함) 인공지능(AI)은 현재 가장 뜨거운 기술 중 하나로, 입문자들이 이 분야에 진입하기 위해서는 체계적인 학습 로드맵이 필요합니다. 더욱 효율적으로 AI를 공부할 수 있도록, 2025년 기준으로 최신 트렌드를 반영한 학습 로드맵을 제시합니다.1. AI 입문 전에 알아야 할 기본기먼저 AI 학습에 필요한 기초 지식(프로그래밍, 수학)을 공부해야 합니다.1.1 프로그래밍 기본기Python: AI 분야에서 가장 많이 사용되는 언어입니다.추천 학습 책 및 사이트: 점프 투 파이썬(파이썬계의 수학의 정석 같은 책),  코드잇(실습 환경이 제공되고 체계적) 혹은 유튜브에 기초 강의가 매우 많습니다.학습키워드: 변수, 함수, 조건문, 반복문, 클래스, 파일 입출력1.2 수학AI의 핵심 원리를 이해하려면 수학이 필수입니다..
FlowiseAI 설치방법: 코딩 없이 쉽게 나만의 챗봇, 추천 시스템을 만드는 툴 FlowiseAI란?FlowiseAI는 오픈소스 비주얼 노코드(Visual No-code) 도구로, LangChain 프레임워크를 기반으로 작동하며 AI 애플리케이션을 쉽게 만들 수 있도록 돕는 도구입니다. Flowise를 사용하면 코드 작성 없이도 블록 기반의 UI를 통해 AI 모델을 설계하고 연결할 수 있습니다. 무료이며, 상업적 이용과 배포가 가능합니다. (간혹 안되는 오픈 소스도 더러 있습니다.) 쉽게 말하자면 코딩 없이 특화된 나만의 GPT를 만드는 무료 웹 기반 도구입니다.챗봇 개발: 금융(은행 등), 헬스케어, 법률, 교육 등 특정 분야에 특화된 챗봇 제작할 수 있습니다.데이터 검색 시스템: 대규모 문서에서 원하는 정보를 빠르게 검색하고 요약 제공할 수 있습니다.AI 자동화 에이전트: 회사에..