본문 바로가기

전체보기109

컴퓨터 비전 1. 컴퓨터 비전이란¶인공니능(AI)의 한 분야로, 컴퓨터와 시스템을 통해 디지털 이미지, 비디오 및 기타 시각적 입력에서 의미 있는 정보를 추출한 다음 이러한 정보를 바탕으로 작업을 실행하고 추천할 수 있게 함AI -> 생각컴퓨터 비전 -> 보기, 관찰, 이해2. 데이터셋¶컴퓨터 비전 모델은 데이터 모음(일반적으로 이미지, 비디오 또는 기타 시각적 정보)을 학습데이터셋은 모델의 성능을 결정하는데 중요(양과 품질)데이터셋의 크기는 모델이 학습 중에 본 예제의 수를 나타내기 때문에 중요데이터셋의 품질은 주석이 잘못 지정되거나 레이블 잘못 저장된 경우 모델의 성능에 많은 부정적 영향을 줄 수 있음다양한 개체 변형의 존재, 조명 조건, 배경 등을 포함한 데이터셋의 다양성도 모델의 견고성을 보장하는데 중요2-1.. 2024. 7. 18.
워드 임베딩 시각화 1. 네이버 영화 리뷰 데이터셋¶총 200,00개의 리뷰로 구성된 데이터로 영화 리뷰를 긍/부정으로 분류하기 위해 만들어진 데이터셋리뷰가 긍정인 경우1, 부정인 경우0으로 표시한 레이블로 구성되어 있음 !sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rf Reading package lists... DoneBuilding dependency tree... DoneReading state information... Donefonts-nanum is already the newest version (20200506-1).0 upgraded, 0 newly installed, 0 to remove and 45 not .. 2024. 7. 18.
자연어 처리를 위한 모델 학습 1. 사전 학습(Pre-training)¶원하는 자연어처리 작업을 수행하는 데이터셋으로 모델을 학습시키기 이전에 일반적인 데이터에 먼저 학습을 시키는 것사전학습은 대량의 자연어 코퍼스를 미리 학습하여, 자연어 코퍼스 안에 포함된 일반화된 언어 특성들을 모델의 파라미터 안에 함축하는 방법사전학습한 모델의 parameter를 이용해서 모델을 초기화한 뒤(pre-training) 사전학습된 모델을 실제 풀려고 하는 문제의 데이터에 fine-tuning하면 임의로 초기화된 parameter를 가진 모델을 처음부터 학습시키는 것 보다 더 높은 성능을 가짐예) 컴퓨터 비전에서 엄청난 크기의 이미지 데이터인 ImageNet에 pre-train된 모델의 parameter 를 가져와서 fine-training 하는 방법.. 2024. 7. 18.
PLM 실습 1. NLI(Natual Language Inference)실습¶두 개의 문장(전제와 가설) 사이의 논리적 관계를 결정하는 자연어 처리 문제!pip install transformersRequirement already satisfied: transformers in /usr/local/lib/python3.10/dist-packages (4.41.2)Requirement already satisfied: filelock in /usr/local/lib/python3.10/dist-packages (from transformers) (3.15.4)Requirement already satisfied: huggingface-hub=0.23.0 in /usr/local/lib/python3.10/dist-p.. 2024. 7. 18.