본문 바로가기
웹디자인 (HTML,JS)

데이터 탐색 및 게시를 위한 오픈 소스 멀티 도구(Datasette)

by 날으는물고기 2023. 11. 3.

데이터 탐색 및 게시를 위한 오픈 소스 멀티 도구(Datasette)

An open source multi-tool for exploring and publishing data

Datasette(데이터셋)는 데이터를 탐색하고 게시하는 데 사용되는 오픈 소스 멀티 툴입니다. 이 도구는 어떤 모양 또는 크기의 데이터든 인터랙티브하고 탐색 가능한 웹 사이트와 관련 API로 게시할 수 있도록 도와줍니다.

 

Datasette는 데이터 저널리스트, 박물관 관리자, 기록 보관자, 지방 정부, 과학자, 연구자 및 데이터를 세계와 공유하고자 하는 누구에게나 도움이 되는 도구입니다.

 

이 도구를 사용하여 데이터를 업로드하고 게시해보거나 데모를 살펴보거나 프로젝트에 대한 비디오를 시청하려면 datasette.io 공식 웹사이트를 방문하세요. 최신 Datasette 뉴스 및 상세한 설명, 예시, 라이브 데모 및 프로젝트 관련 토론을 위한 Discord 채널에 참여하는 방법에 대한 정보는 공식 웹사이트에서 확인할 수 있습니다. 또한 Datasette 생태계의 새로운 기능 및 팁 및 트릭에 대한 뉴스를 받아보려면 Datasette 뉴스레터에 가입할 수 있습니다.

 

설치

Mac 사용자의 경우, Homebrew를 사용하여 가장 쉽게 Datasette를 설치할 수 있습니다.

brew install datasette

또는 pip 또는 pipx를 사용하여 설치할 수도 있습니다.

pip install datasette

Datasette는 Python 3.8 이상을 필요로 합니다. Docker와 같은 다른 옵션에 대한 자세한 설치 지침도 제공됩니다.

 

기본 사용법

datasette serve path/to/database.db

이 명령은 포트 8001에서 웹 서버를 시작합니다. 웹 인터페이스에 액세스하려면 http://localhost:8001/을 방문하면 됩니다.

serve는 기본 하위 명령어이며, 필요하면 생략할 수 있습니다.

 

OS X에서 Chrome을 사용하는 경우 다음과 같이 브라우저 히스토리에 대해 Datasette를 실행할 수도 있습니다.

datasette ~/Library/Application\ Support/Google/Chrome/Default/History --nolock

이 명령을 실행하면 http://localhost:8001/History/downloads를 방문하여 다운로드 데이터를 둘러볼 수 있는 웹 인터페이스가 표시됩니다.

 

metadata.json

생성된 Datasette 웹 사이트에 라이선스 및 소스 정보를 포함하려면 다음과 같은 형식의 JSON 파일을 사용할 수 있습니다.

{
    "title": "Five Thirty Eight",
    "license": "CC Attribution 4.0 License",
    "license_url": "http://creativecommons.org/licenses/by/4.0/",
    "source": "fivethirtyeight/data on GitHub",
    "source_url": "https://github.com/fivethirtyeight/data"
}

이 정보를 metadata.json 파일에 저장하고 다음과 같이 Datasette를 실행하면 됩니다.

datasette serve fivethirtyeight.db -m metadata.json

이렇게 하면 라이선스 및 소스 정보가 색인 페이지와 푸터에 표시되며 API에서도 제공됩니다.

 

datasette publish

Heroku 또는 Google Cloud Run을 구성한 경우, Datasette는 단일 명령으로 하나 이상의 SQLite 데이터베이스를 인터넷에 배포할 수 있습니다.

 

Heroku에 배포하려면 다음과 같이 실행할 수 있습니다.

datasette publish heroku database.db

또는 Google Cloud Run에 배포하려면 다음과 같이 실행할 수 있습니다.

datasette publish cloudrun database.db

이 명령은 Datasette 응용 프로그램과 지정된 SQLite 데이터베이스 파일을 포함하는 Docker 이미지를 생성한 다음 해당 이미지를 Heroku 또는 Cloud Run에 배포하고 생성된 웹 사이트 및 API에 액세스할 수 있는 URL을 제공합니다.

 

Datasette Lite

Datasette Lite는 Python 웹 응용 프로그램 서버가 필요하지 않고 브라우저에서 완전히 실행되도록 WebAssembly를 사용하여 패키지화된 Datasette입니다. Datasette Lite에 대한 자세한 내용은 Datasette Lite 문서에서 확인할 수 있습니다.

728x90

댓글