본문 바로가기

전체 글

(23)
Kubernetes로 대용량 오픈소스 웹 상용화하기 ⑥: 서비스 안정성을 위한 튜닝(성능테스트, HA 구성, 리소스 최적화) Kubernetes로 대용량 오픈소스 웹 상용화하기 시리즈 목차대용량 트래픽을 고려한 오픈소스 선정 및 분석컨테이너화와 Kubernetes 리소스 관리 (Pod, Deployment, StatefulSet)Helm chart로 Kubernetes에 오픈 소스 웹 배포하기Kubernetes 서비스(Service) 및 Ingress 관리 (HTTP 및 gRPC 프로토콜 이해)보안 강화를 위한 인증서(Certificate) 관리서비스 안정성을 위한 튜닝(성능테스트, HA 구성, 리소스 최적화)2025.08.10 - [Technical architecture/Kubernetes] - Kubernetes로 대용량 오픈소스 웹 상용화하기 ⑤: 보안 강화를 위한 인증서(Certificate) 관리 Kubernetes..
Kubernetes로 대용량 오픈소스 웹 상용화하기 ⑤: 보안 강화를 위한 인증서(Certificate) 관리 Kubernetes로 대용량 오픈소스 웹 상용화하기 시리즈 목차대용량 트래픽을 고려한 오픈소스 선정 및 분석컨테이너화와 Kubernetes 리소스 관리 (Pod, Deployment, StatefulSet)Helm chart로 Kubernetes에 오픈 소스 웹 배포하기Kubernetes 서비스(Service) 및 Ingress 관리 (HTTP 및 gRPC 프로토콜 이해)보안 강화를 위한 인증서(Certificate) 관리서비스 안정성을 위한 튜닝(성능테스트, HA 구성, 리소스 최적화) 2025.07.27 - [Technical architecture/Kubernetes] - Kubernetes로 대용량 오픈소스 웹 상용화하기 ④: Ingress로 외부통신 설정하기 Kubernetes로 대용량 오픈소스..
심층 리서치 구현: OpenAI Agent SDK를 활용해서 Deep Research Agent 만들기 이번 글에서는 OpenAI의 Agent SDK를 이용해 복잡한 질문에 대한 깊이 있는 답변을 제공하는 Deep Research Agent를 구현하는 과정에 대해 설명합니다. Deep Research란? 여러 단계의 정보 검색과 추론을 반복적으로 수행하여 보다 심층적이고 복합적인 질문에 대한 종합적인 답변을 생성하는 프로세스를 의미합니다. 이전 글(전통 RAG의 한계와 ReAct 기반 Tool-Using 에이전트)에서 "ReAct: Synergizing Reasoning and Acting in Language Models"의 개념에 대해 소개해드렸는데요, 이 논문은 언어 모델이 추론(reasoning)과 행동(acting)을 반복적으로 수행하여 복잡한 문제를 해결하는 방법론을 제시하고 있습니다. 참고: ..
Kubernetes로 대용량 오픈소스 웹 상용화하기 ④: Ingress로 외부통신 설정하기 외부 IP를 DNS 레코드(A레코드)에 등록합니다.Kubernetes로 대용량 오픈소스 웹 상용화하기 시리즈 목차대용량 트래픽을 고려한 오픈소스 선정 및 분석컨테이너화와 Kubernetes 리소스 관리 (Pod, Deployment, StatefulSet)Helm chart로 Kubernetes에 오픈 소스 웹 배포하기Kubernetes 서비스(Service) 및 Ingress 관리 (HTTP 및 gRPC 프로토콜 이해)보안 강화를 위한 인증서(Certificate) 관리서비스 안정성을 위한 튜닝(성능테스트, HA 구성, 리소스 최적화)[Technical architecture/Kubernetes] - Kubernetes로 대용량 오픈소스 웹 상용화하기 ③: Helm chart로 Kubernetes에 오..
전통 RAG의 한계와 ReAct 기반 Tool-Using 에이전트로 멀티홉 추론 해결하기 전통 RAG의 한계 (Retrieval-Augmented Generation의 한계)RAG(Retrieval-Augmented Generation)는 대형 언어 모델(LLM)이 응답을 생성할 때, 외부 지식베이스에서 관련 정보를 검색하여 활용하는 기법입니다. 예를 들어 질문에 답하기 위해 벡터 DB 등에서 관련 문서를 찾아와 LLM의 프롬프트에 포함시키는 방식이죠. 이러한 전통적인 RAG 파이프라인은 질문 → 키워드 기반 벡터 검색 → 상위 문서 반환 → 답변 생성의 단순 구조로 이루어집니다. 하지만 이 방식에는 큰 한계가 있습니다. 질문 자체가 여러 단계를 거쳐야 풀리는 경우(멀티홉 추론)에는 한 번의 벡터 검색으로는 충분한 정보를 얻기 어렵습니다 (genui.com). 다시 말해, 질문에 필요한 단서..
Kubernetes로 대용량 오픈소스 웹 상용화하기 ③: Helm chart로 Kubernetes에 오픈 소스 웹 배포하기 Kubernetes로 대용량 오픈소스 웹 상용화하기 시리즈 목차대용량 트래픽을 고려한 오픈소스 선정 및 분석컨테이너화와 Kubernetes 리소스 관리 (Pod, Deployment, StatefulSet)Helm chart로 Kubernetes에 오픈 소스 웹 배포하기Kubernetes 서비스(Service) 및 Ingress 관리 (HTTP 및 gRPC 프로토콜 이해)보안 강화를 위한 인증서(Certificate) 관리서비스 안정성을 위한 튜닝(성능테스트, HA 구성, 리소스 최적화)이전 글: [Technical architecture/Kubernetes] - Kubernetes로 오픈소스 상용화하기 ②: 컨테이너화와 Kubernetes 리소스 관리 Kubernetes로 오픈소스 상용화하기 ②: 컨테..
Cursor보다 좋고 싸다: Mac에서 Gemini CLI 사용하기 설치 및 실행 방법설치 방법은 매우 간단합니다.터미널에서 아래 코드를 실행하면 설치부터 실행까지 한 번에 됩니다.npm install -g @google/gemini-cligemini 만약 npm이 없다면 먼저 노드를 설치하고 다시 위 명령어를 실행합니다.brew install node 권한 부여디스크 접근 권한이 없으면 파일을 읽을 때 못 찾겠다, 읽을 수 없다 등 헛소리를 하게 되니설정 > 전체 디스크 접근 권한에서 gemini를 실행하는 터미널, iTerm에 권한을 부여해 주세요.실행 방법처음 실행을 하게 되면 Google Login, API Key 입력 등 다양한 인증 방법이 나옵니다.저는 그냥 구글 계정으로 인증했습니다. 또 웹앱 개발 등 cursor처럼 특정 목적으로 해당 폴더에 들어가서 g..
강화학습 쉽게 이해하기: 강화학습 개념과 벨만 방정식 강화학습이란?강화학습(Reinforcement Learning)은 스스로 행동하면서 보상을 최대화하는 방법을 배우는 알고리즘입니다.딥러닝이나 지도학습처럼 ‘정답’(라벨링 등)을 주지 않고, 행동 → 결과 → 보상만으로 학습합니다.주요 구성 요소Agent(행위자): 학습을 수행하는 주체 (예: 로봇 청소기, 게임 캐릭터)Environment(환경): 에이전트가 상호작용하는 세계State(상태): 현재 상황 정보Action(행동): 선택 가능한 움직임Reward(보상): 행동의 즉각적인 피드백강화학습 예시 - 미로를 탈출하는 로봇 청소기로봇 청소기가 미로를 탈출한다고 가정해봅시다.에이전트: 로봇 청소기환경: 미로상태: 현재 위치행동: 상하좌우 이동보상: 출구에 가까워지면 +1, 막다른 길이면 -1로봇은 수없..