주석 데이터셋 생성

기능 설명

이 연산자는 특정 형식의 주석 데이터를 COCO 데이터셋 형식으로 변환하는 데 사용되며, 딥러닝 모델 학습을 위해 CVAT 주석 플랫폼에 직접 업로드할 수 있습니다.

사용 사례

딥러닝 데이터를 준비하며, 주석 최적화 및 모델 데이터 관리에 추가로 사용될 수 있습니다.

입력 및 출력

입력 항목

저장 경로: 원본 주석 데이터가 있는 폴더를 지정합니다. 연산자는 이 폴더에서 .png 파일을 찾고 각 .png 파일에 해당하는 동일한 이름의 .json 파일이 있을 것으로 예상합니다(예: image1.png는 image1.json에 해당).

이 입력 포트가 데이터에 연결된 경우(즉, 경로가 제공된 경우), 이 경로는 매개변수 패널에 설정된 "저장 경로" 매개변수를 원본 데이터의 읽기 경로로 덮어씁니다.

이 입력 포트가 데이터에 연결되지 않은 경우(비어 있는 경우), 연산자는 매개변수 패널의 "저장 경로"에 지정된 경로를 원본 데이터의 읽기 경로로 사용합니다.

출력 항목

파일 이름: 실제로 저장된 COCO 데이터셋 파일의 주 이름.

매개변수 설명

주석 이름 매개변수는 정확한 형식의 배열로 제공해야 합니다. 각 사용자 정의 범주 이름은 영문 큰따옴표(")로 묶어야 합니다(예: ["범주A", "범주B"]). 그렇지 않으면 "서식 지정 실패"라는 메시지가 표시됩니다.

저장 경로

매개변수 설명

파일을 저장할 대상 폴더 경로를 지정하는 데 사용됩니다.

매개변수 조정 가이드

  • 경로 지정: 유효한 폴더 경로를 직접 입력하거나 오른쪽 아이콘을 클릭하여 폴더 경로를 선택합니다.

  • 경로 미지정: 경로를 입력하지 않으면 연산자는 기본적으로 .transfertech의 atom 폴더에 file_save_dir라는 하위 폴더를 만들어 저장 경로로 사용합니다. 이는 임시 저장이나 특정 저장 위치에 신경 쓰지 않을 때 편리합니다.

  • 경로 확인: 연산자는 지정된 경로가 유효한지 확인합니다. 경로가 기존 파일(폴더가 아님)을 가리키거나 경로가 유효하지 않으면 연산자에서 오류를 보고합니다. 지정된 경로가 존재하지 않으면 생성을 시도합니다.

이름 저장

매개변수 설명

파일 접미사를 포함하지 않는 저장 이름 지정.

매개변수 조정 가이드

나중에 검색 및 관리가 용이하도록 설명적인 이름을 사용하고 특수 문자 사용을 피하는 것이 좋습니다.

기본 이름: data

단일 파일만 저장

매개변수 설명

파일 저장 전략을 설정하여 단일 파일 또는 여러 파일로 저장합니다.

매개변수 조정 가이드

  • 꺼짐(기본값): 여러 파일을 생성하고 중복을 피하기 위해 지정된 파일 이름 뒤에 자동으로 타임스탬프를 추가합니다. 과거 데이터나 여러 실행 결과를 기록해야 하는 시나리오에 적합합니다.

  • 켬: 연산자는 실행될 때마다 지정된 이름을 파일 이름으로 사용하여 데이터를 저장하려고 시도합니다. 파일이 이미 존재하는 경우 새 데이터가 이전 파일을 덮어씁니다. 이전 결과를 덮어쓰는 등 고정 파일 이름 출력이 필요한 시나리오에 적합합니다.

최대 메모리 저장

매개변수 설명

저장 디렉터리에 저장할 수 있는 파일의 최대 총 크기를 설정합니다. 폴더 내 관련 파일의 총 크기가 이 제한을 초과하면 소프트웨어는 해당 디렉터리에서 가장 오래된 동일한 유형의 파일을 삭제하여 공간을 확보하려고 시도합니다.

매개변수 조정 가이드

사용 가능한 디스크 공간 및 데이터 보존 요구 사항에 따라 이 값을 설정하십시오.

  • 작은 값: 이전 파일을 더 자주 삭제하여 디스크 공간을 절약하지만 과거 데이터가 더 빨리 손실될 수 있습니다.

  • 큰 값: 더 많은 과거 데이터를 저장할 수 있지만 더 많은 디스크 공간을 차지합니다.

매개변수 범위

[0.00001, 10], 기본값: 10, 단위: GB

주석 이름

매개변수 설명

데이터셋의 모든 가능한 객체 범주 이름을 정의하는 데 사용되는 문자열 목록입니다. 목록의 각 문자열은 범주를 나타냅니다.

매개변수 조정 가이드

  • 사용자 지정 범주: 필요에 따라 사용자 지정 범주 이름으로 이 목록을 설정합니다. 예를 들어 프로젝트에서 "cat", "dog", "person"을 감지하는 경우 ["cat", "dog", "person"]으로 설정할 수 있습니다.

  • 범주 ID 매핑: 연산자는 목록의 첫 번째 이름을 ID 1에, 두 번째를 ID 2에 자동으로 매핑합니다. 그러나 주석 파일에서 레이블 필드는 0부터 시작하는 숫자 문자열을 사용하여 범주 이름에 해당합니다.

  • 기본값: 이 목록이 비어 있으면 연산자는 기본적으로 ["0", "1", "2", "3", "4"]를 범주 이름으로 사용하며 최대 5개의 범주를 지원합니다.