Deep Learning
-
PyTorch | GANDeep Learning/PyTorch 2022. 1. 9. 20:54
GAN(Generative Adversarial Network) GAN 기초 GAN은 생성을 하는 모델이다. CNN과 RNN같은 모델로는 새로운 이미지나, 음성 데이터를 창작해 낼 수 없다. GAN은 이미지, 음성 등을 새롭게 '창작'하는 모델이다. 생성자와 판별자 GAN은 서로 대립하는 두 모델이 경쟁하며 학습 하는 방식이다. 생성자(Generator)와 판별자(Discriminator) 두가지 모델로 구성되어 있다. 생성자 모델은 무작위 텐서가 입력으로 들어왔을 때, 가짜 이미지를 만들어내는 역할을 한다. 판별자 모델은 이미지가 입력으로 들어왔을 때, 진짜 이미지인지 가짜 이미지인지 판별하는 역할을 한다. 생성자가 만들어낸 가짜 이미지를 판별자는 가짜라고 판별해야한다. 생성자는 판별자를 속이기 위해 ..
-
-
MMDetection | Faster RCNNDeep Learning/vision 2021. 8. 15. 06:51
MMDetection https://github.com/chulminkw/DLCV_New/blob/main/faster_rcnn/mm_faster_rcnn_inference.ipynb 위 github 코드를 기반으로 작성함. MMDetection은 pytorch 기반의 Object Detection / Segmentation 패키지이다. 최신의 다양한 Object Detection, Segmentation 알고리즘을 패키지로 구현하여 제공한다. 뛰어난 구현 성능, 효율적인 모듈 설꼐, config 기반으로 데이터부터 모델 학습, 평가 까지 이어지는 간편한 파이프라인을 적용했다. 다양한 Prebuilt 모델을 지원한다. Back bone Object Detection / Segmentation MMDete..
-
OpenCV 영상 처리Deep Learning/vision 2021. 8. 7. 02:57
OpenCV https://github.com/chulminkw/DLCV/blob/master/Detection/preliminary/OpenCV%EC%9D%B4%EB%AF%B8%EC%A7%80%EC%99%80%20%EC%98%81%EC%83%81%EC%B2%98%EB%A6%AC%20%EA%B0%9C%EC%9A%94.ipynb 위의 깃허브 코드를 기반으로 작성한다. OpenCV는 방대한 컴퓨터 비전 관련 라이브러리와 손쉬운 인터페이스를 제공해주는 모듈이다. 이를 활용해 아주 쉽게 영상처리를 할 수 있다. 이미지 로딩 import cv2 import matplotlib.pyplot as plt img_array = cv2.imread("파일명") plt.imshow(img_array) imread()를 이..
-
Object Detection / Segmentation 주요 데이터셋Deep Learning/vision 2021. 8. 7. 02:20
Dataset Object Detection과 Sementation 딥러닝 패키지들은 어떤 데이터셋을 사용할까?? 대표적으로 Pascal VOC, MS COCO, Googel Open Images가 있다. 1.PASCAL VOC PASCAL VOC 2012 데이터가 가장 최신의 데이터이고 가장 많이 사용한다. annotation 파일의 포맷은 XML이고 20개의 오브젝트 카테고리를 가지고 있다. 2.MS COCO 80개의 오브젝트 카테고리를 가지고 있고 annotation 파일의 포맷은 json 이다. 300만개의 image들과 1500 개의 object를 가지고있다. 하나의 image에 평균 5개정도의 object 들로 구성되어있다. 다른 데이터 셋에 비해 object가 많아서 난이도가 높은 데이터를 ..
-
Object DetectionDeep Learning/vision 2021. 8. 4. 03:14
Object Detection object detection은 사물의 위치를 찾아내는 기술이다. 사물의 위치를 찾을 뿐 아니라 무슨 사물인지 분류하기도 한다. 기존의 CNN을 활용한 classification이 쓰인다. Localization : 하나의 이미지에 하나의 obeject를 찾아 내는 것 Detection : 하나의 이미지에 여러 개의 object 를 bounding box로 찾는다. Segmentation : Dectection보다 더 발전된 행태, 하나의 이미지에 여러개의 object 를 픽셀단위로 찾는다. Localization / Detection은 해당 Object의 위치를 Bounding box로 찾고, Bounding box 내의 오브젝트를 판별한다. =>Bounding box r..
-
순환 신경망 RNNDeep Learning/밑딥2(자연어 처리) 2021. 7. 23. 22:08
CBOW 모델의 문제점 Tom was watching TV in his room. Mary came into the room. Mary said hi to ?. 문장의 길이가 길면 앞의 단어가 무시될 수 있다. You say ? and I say hello. 맥락 단어의 순서가 무시된다. (you, say)와 (say, you)는 행렬곱층을 거쳐 평균을 하면 같은 값이 나온다. 이러한 문제를 해결한 모델이 RNN (Recurrent Neural Network)이다. RNN RNN은 순환하는 경로가 있어 데이터가 끊임없이 순환한다. 과거의 정보를 기억하는 동시에 최신 데이터로 갱신한다. 아무리 문장의 길이가 길더라도 맨앞의 단어의 정보를 기억할 수 있다는 뜻이다. RNN을 시각 단위로 나열하면 아래와같이 ..
-
추론 기반 기법Deep Learning/밑딥2(자연어 처리) 2021. 7. 16. 17:35
추론 기반 기법의 개요 추론 기반 기법은 통계 기반 기법과 달리 단어에서 문맥 또는 문맥에서 단어를 예측하는 방법이다. You ? goodbye and I say hello. You say ? and I say hello. You say goodbye ? I say hello. You say goodbye and ? say hello. You say goodbye and I ? hello. You say goodbye and I say ?. CBOW(continous bag-of-words)모델 CBOW 모델은 맥락으로부터 target을 추측하는 용도의 신경망이다. 입력층에는 추론할 단어의 맥락의 원핫 벡터이다. 은닉층에서는 평균을 구한다. 정답 레이블은 추론할 단어의 원핫 벡터이다. 편향과 활성화 함수..