[Ubuntu] AIHub CLI(aihubshell)를 이용한 다운로드 방법


aihubshell 이용한 데이터 다운 방법

안녕하세요, aihubshell을 이용하여 데이터를 다운받는 방법을 알아보겠습니다.

aihubshell 실행 명령어 파일 다운

aihubshell을 다운로드 합니다.
curl -o "aihubshell" https://api.aihub.or.kr/api/aihubshell.do
다운받은 파일의 실행 권한을 부여합니다.
chmod +x aihubshell
해당 파일을 어떤 경로에서든 명령어로 실행할 수 있도록 설정합니다. (정상 등록 확인은 아래 그림 명령어 참고)
sudo cp aihubshell /usr/bin

aihubshell 명령어를 이용한 데이터 다운

다운받으려는 데이터셋의 key값을 확인합니다. (여기선 163 데이터 사용)
aihubshell -mode l | grep '공사'
만약 전체 데이터셋이 아닌 일부 파일만 다운받고자 하면 해당 데이터셋의 파일 key값을 확인합니다. (여기선 559879, 559880 데이터 사용)
aihubshell -mode l -datasetkey 163
확인한 key값을 이용해 데이터를 다운받습니다.
aihubshell -mode d -datasetkey 163 -filekey 559879,559880 -aihubapikey 'your_api_key'
apikey는 여기에서 발급받을 수 있습니다.

다운받은 zip파일 압축 해제

사이트를 통해 다운받는 경우 분할된 part 파일을 하나로 병합해야하는 귀찮음이 존재합니다.
aihubshell을 이용한 경우에는 자동으로 part 파일 병합까지 진행해줍니다.
다운받은 559879와 559880 파일만 존재하는걸 확인할 수 있습니다.
이후 unzip을 통해 편하게 해당 데이터를 압축 해제할 수 있습니다.
unzip 'your_zip_file'


참고 문헌

[1]   https://aihub.or.kr/devsport/apishell/list.do?currMenu=403&topMenu=100

댓글

이 블로그의 인기 게시물

[python] selenium close와 quit 차이점

[linux] 리눅스 파일 인코딩 확인 및 변경 방법

[opencv-python] 이미지 크기조절(resize) 하는 법