TEXT4 728x90 Lucene 기반 Elasticsearch Text vs Keyword 필드 타입 쿼리 최적화 Text 필드 (Analyzed Field)텍스트를 토큰으로 분리하여 저장전문 검색(Full-text search)에 최적화대소문자 변환, 형태소 분석 등 텍스트 처리 수행// 원본: "Hello World 2024"// 저장: ["hello", "world", "2024"] // 토큰화 + 소문자 변환Keyword 필드전체 문자열을 하나의 단위로 저장정확한 일치, 정렬, 집계에 최적화원본 그대로 저장 (대소문자 유지)// 원본: "Hello World 2024"// 저장: "Hello World 2024" // 그대로 저장토큰화 과정 상세 분석1. Standard Analyzer 동작 방식GET /_analyze{ "text": "web-prod-ab12-server.company.com", ".. 2025. 7. 30. 회의(대화) 음성 녹음을 텍스트로 변환(STT)하는 방법 음성 녹음을 텍스트로 변환(TTS: Text-to-Speech의 반대인 STT: Speech-to-Text)을 하는 방법에는 여러 가지가 있습니다. 아래에는 이를 구현하는 몇 가지 방법을 설명합니다.방법 1: Google Cloud Speech-to-Text API 사용Google Cloud의 Speech-to-Text API는 매우 높은 정확도의 음성 인식 기능을 제공합니다.Google Cloud Console에서 프로젝트를 생성합니다.Speech-to-Text API를 활성화합니다.서비스 계정을 생성하고 JSON 형식의 키 파일을 다운로드합니다.코드 예시 (Python)import osfrom google.cloud import speech# Google Cloud 인증 설정os.environ["GO.. 2024. 8. 15. Regex (정규표현식) vs Text Replace (문자열 치환) 개념과 구문 (?P.*?)와 replace(".*", "\1") 방식의 치환은 텍스트 처리와 정규 표현식(regex)에 있어서 주로 사용되는 두 가지 다른 접근 방식입니다. 이 두 방식을 이해하기 위해서는 먼저 정규 표현식의 기본적인 개념과 구문에 대한 이해가 필요합니다.(?P.*?) 설명구문: (?Ppattern)용도: 이 구문은 정규 표현식에서 그룹화(grouping)와 함께 이름을 부여하는 데 사용됩니다. 여기서 name은 그룹에 부여할 이름이고, pattern은 해당 그룹이 매칭할 패턴입니다.활용: Python의 re 모듈 같은 정규 표현식을 지원하는 언어나 라이브러리에서 사용됩니다. 이름이 부여된 그룹은 매칭된 텍스트를 더 쉽게 참조하고 사용할 수 있게 해 줍니다. 예를 들어, 로그 파일에서 특정 로그 유형.. 2024. 5. 3. Slack에서 테이블 작성과 이미지 삽입 Markdown 사용 방법 Slack에서 Markdown 테이블을 만들려면 다음과 같이 파이프 (|)와 하이픈 (-)을 사용하여 작성할 수 있습니다. 아래는 간단한 예제입니다.| Header 1 | Header 2 | Header 3 || -------- | -------- | -------- || Cell 1-1 | Cell 1-2 | Cell 1-3 || Cell 2-1 | Cell 2-2 | Cell 2-3 |이 예제에서는 세 개의 열과 두 개의 행을 가진 테이블이 생성됩니다. 각 열은 파이프 기호로 구분되고, 각 행은 하이픈과 파이프로 구성됩니다. 표의 헤더를 나타내려면 첫 번째 행에 헤더 셀을 작성하고 두 번째 행에 각 열의 정렬을 나타내기 위해 하이픈으로 채워진 셀을 추가합니다. 그런 다음 그 아래에 데이터 .. 2024. 1. 27. 이전 1 다음 728x90 728x90