본문 바로가기

💻 개발 이야기22

[ELK] Nori(노리) Tokenizer로 형태소 분석하기 /w Docker 안녕하세요. 황진성입니다. 오늘은 한글 형태소 분석기를 사용해서 주어진 텍스트에서 필요한 단어만 뽑아내는 방법에 대해 알아보겠습니다. 또한 나만의 사전을 만들어서 커스텀 분석기를 만드는 것까지 실습해 보겠습니다. 아래에서 진행한 모든 내용은 작성일 기준 Elasticsearch 8.10에서 정상적으로 동작합니다. 노리 형태소 분석기란? 한국어 형태소 분석기 중 많이 사용되는 형태소 분석기인 노리(Nori) 입니다. 노리는 Elasticsearch 엔진과 함께 구동하는 것이 일반적입니다. Lucene 분석 모듈을 사용하기 때문입니다. 노리는 mecab-ko-dic 사전을 통해 한국어 분석을 수행합니다. (제가 ES와 분리된 형태로 사용하는 방법을 찾아봤는데 못 찾았습니다.. 아시는 분은 제보 부탁드립니다... 2023. 10. 30.
[ELK] 엘라스틱서치 데이터 노드를 효율적으로 관리하는 방법 안녕하세요. 황진성입니다. 지난 글에 이어서 데이터 노드를 효율적으로 관리/활용하는 방법에 대해 알아보겠습니다. 연산이 많고 접근이 잦은 데이터와 거의 접근되지 않는 데이터를 분리하면 비용, 공간 측면에서 크게 절약할 수 있습니다. 주로 대용량 데이터를 다루는 상황이라면 차이가 극명하게 날텐데, Elasticsearch에서는 어떻게 이 문제를 해결하는지 알아봅시다. 혹시 독자님도 JVM based 언어를 많이 사용하시는지 ~? 저는 이번 글을 쓰면서 JVM GC 힙 영역의 Survivor1 + Survivor2 + Eden + Old 구조가 떠올랐습니다. 접근 확률에 따라 점점 밀어넣는 방식인데, 그림을 대충 보시고 아래 글을 읽으면 이해가 조금 더 빠를 것 같습니다 😁 이 글의 내용은 작성일 기준 최신.. 2023. 10. 24.
[ELK] 엘라스틱서치 클러스터를 구성하는 다양한 노드에 대해 알아보자 안녕하세요. 황진성입니다. 오늘은 Elasticsearch에서 클러스터를 구성하는 다양한 종류의 노드를 알아보고, 특히 마스터 노드가 선출되는 과정과 주의해야 할 점에 대해서도 알아보겠습니다. 이 글의 내용은 작성일 기준 최신 버전인 Elasticsearch 8.10 문서를 따라 작성됐습니다. 클러스터 구성에 앞서, 클러스터를 구성해야 하는 이유 일반적으로 클러스터는 여러 대의 컴퓨터를 병렬로 연결해서 마치 하나의 시스템인 것처럼 구성하는 것을 의미합니다. 클러스터를 구성하면 시스템 장애를 대비한 고가용성(High availability)을 높이는 동시에 시스템 성능도 높일 수 있습니다. Elasticsearch는 클러스터 구성에 필요한 여러 기능을 제공하고 있으며, 분산 처리를 지원하고 있기 때문에 굉.. 2023. 10. 17.
[Infra] UUID vs Snowflake ID : 분산 시스템에서 유일한 ID를 만들어보자 안녕하세요. 황진성입니다. 오늘은 분산 시스템에서 유일한 ID를 만드는 방법에 대해 알아보겠습니다. 다양한 방법이 있지만, Twitter(X)에서 만든 Snowflake 방식과 UUID 방식을 주로 비교해 보겠습니다. 그리고 ID 생성기를 직접 Kotlin으로 구현하고, Spring Boot, JPA와 통합해서 간단한 블로그 애플리케이션을 만들어보겠습니다. 개요 개발을 하다 보면 유일한 ID를 만들어서 데이터를 관리해야 할 일이 생기기 마련입니다. 대표적으로 관계형 데이터베이스의 테이블 내 레코드 별로 고유 식별자를 가지는 경우가 있습니다. PK로써 테이블 내 고유함을 결정하는 지표가 되며, 인덱스 생성 시에도 활용합니다. 하지만 데이터와 트래픽이 많아진다면 ID 부여 방식에 대해 한 번쯤 고민해봐야 합.. 2023. 9. 10.
[ELK] 초심자를 위한 Elasticsearch, Logstash, Kibana를 Docker로 실행하기 안녕하세요. 황진성입니다. 지난 글에서 ELK Stack에 대한 간단한 설명과 설치/실행하는 방법에 대해 전해드렸는데, 이번글에서는 도커 컨테이너를 활용해서 ELK를 실행하는 방법을 전해드리려 합니다. 아래 프로젝트를 활용합니다. https://github.com/deviantony/docker-elk GitHub - deviantony/docker-elk: The Elastic stack (ELK) powered by Docker and Compose. The Elastic stack (ELK) powered by Docker and Compose. - GitHub - deviantony/docker-elk: The Elastic stack (ELK) powered by Docker and Compos.. 2023. 8. 20.
[ELK] Elasticsearch, Logstash, Kibana를 설치+실행하고 간단하게 알아보자 안녕하세요. 황진성입니다. 어쩌다 보니 갓 인싸 개발자 큰돌님과 함께 ELK 스터디를 진행하게 될 기회가 생겼는데, 스터디하면서 알게 된 내용, 실습한 내용, 삽질한 내용을 기록해보려 합니다. ELK란? Elasticsearch, Logstash, Kibana를 묶어서 ELK 혹은 ELK Stack이라고 부릅니다. 하지만 5 버전부터 Beats가 포함되며 Elastic Stack이라고 불립니다. 하지만 저는 ELK가 조금 더 직관적인 것 같아서 ELK라고 부르는 편입니다. 그렇다면 Elasticsearch, Logstash, Kibana, Beats가 뭐하는 서비스인지 궁금해집니다. (이미 너무 유명하니까) 하나씩 간단히만 알아봅시다. Elasticsearch Apache Lucene 기반의 Full-t.. 2023. 7. 23.
[Kotlin] 코루틴 이해를 위한 배경 지식 안녕하세요. 황진성입니다. 최근에 이직을 했고, 합류한 팀에서 비즈니스 로직 틈틈이 코루틴을 사용하는 것을 확인했습니다. 저는 비동기, 병렬 처리 등에 대해서 제대로 공부하거나 사용해 본 적이 없어서 코드를 명확하게 이해하는 것이 힘들었습니다. 단순히 공식 문서에서 예제 한두번 돌려보고 대충 이해하고 쓰기만 했습니다. 꼼꼼히 코드 리뷰를 해주실 때 잘못 사용된 부분을 알려 주시긴 하는데, 언제까지 이렇게 개발할 수 없었습니다. 이 참에 코루틴에 대해 어느 정도 자세히 알아보고자 합니다. 코루틴과 코루틴을 감싸고 있는 이야기를 모두 해볼까 하는데, 여러 개의 포스트로 나눠서 차근차근 정리해 보겠습니다. 1편에서는 "코루틴을 감싸고 있는 이야기"에 집중해서 이야기해보겠습니다. 동시성(Concurrency)과.. 2023. 6. 24.
[NLP] ChatGPT 똑똑하게 활용하기 (ft. Prompt Engineering) 안녕하세요. 황진성입니다. 오늘은 ChatGPT를 조금 더 똑똑하게 활용하는 방법에 대해 알아보겠습니다. 그리고 프롬프트 엔지니어링에 대해 찍먹 해보도록 하겠습니다. ChatGPT란? 기존의 GPT-3가 엄청난 파라미터 개수로 뛰어난 성능을 보여줬는데, 사람의 의도 파악과 윤리 의식 판단 기능이 추가된 InstructGPT 모델이 나왔습니다. ChatGPT는 InstructGPT에 대화형 플랫폼을 함께 탑재해서 출시된 SaaS라고 이해하시면 됩니다. ChatGPT에게 ChatGPT가 뭔지 질문해봤습니다. 언제 활용하는 게 좋을까? 소프트웨어 엔지니어로 일을 하다 보면, 끊임없이 새로운 기술을 학습해야 하는 것은 당연합니다. 그 과정에서 내 궁금증을 해소하기 위해 구글 검색을 많이 하곤 하는데, 이 또한 .. 2023. 4. 15.
[PostgreSQL] 운영 중인 테이블에 인덱스 생성하기 안녕하세요. 황진성입니다. 오늘은 운영 중인 데이터베이스에 인덱스를 생성하는 방법에 대해 알아보겠습니다. 그냥 만들면 되는 거 아냐? 테이블에 인덱스를 생성하면, 인덱스를 구성하는 동안 테이블에 Lock이 걸리게 됩니다. 운영 중인 테이블에 인덱스를 생성하면 인덱스가 생성되는 동안 서비스가 중지될 수도 있습니다. 따라서 인덱스를 생성한다면 신중하게 판단해야 합니다. 일반적으로 운영 중인 테이블에 인덱스를 생성한다면 아래와 같이 생성합니다. 이해를 위해 Pseudo code로 작성했으며, DBMS Vender에 따라 문법이 조금씩 다를 수 있습니다. -- 1. 기존 테이블과 동일한 구조, 데이터를 가진 새로운 테이블을 생성한다. CREATE TABLE new_table_name AS ( SELECT * F.. 2023. 4. 12.
[Spring] RestTemplate 에러 핸들러 커스텀하기 안녕하세요. 황진성입니다. 오늘은 Spring Web에서 제공하는 RestTemplate의 ErrorHandler를 커스텀해보겠습니다. 목적 우리는 RestTemplate으로 클라이언트를 생성해서, 또 다른 서버로 동기(sync) 요청을 보낼 수 있습니다. RestTemplate의 getForEntity 메서드로 GET 요청을 보내면, Response로 받는 JSON을 객체 형태로 변환해서 반환해줍니다. RestTemplate restTemplate = new RestTemplate(); ResponseEntity response = restTemplate.getForEntity( "http://localhost:8080/users/1", User.class ); User user = response.g.. 2022. 7. 10.