목록전체 글 (182)
취미가 좋다
논문 링크 ResNeSt : Split-Attention Networks Facebook, UC Davis, Snap, Amazon, ByteDance, SenseTime ResNet 계열 image classification 모델이다. 1. Introduction ResNet 이후에 좋은 성능을 가지는 모델들이 나왔지만, ResNet 이 simple & modular 한 구조를 가지기 때문에 아직까지도 많이 사용된다. ResNet의 단점은 크로스 채널 정보를 반영하지 못하고 있다는 것이다. 이 논문의 ResNeSt 는 ResNet 의 residual block 을 replace 하는 새로운 block을 제시한다. 유사한 모델 complexity를 가질 때, 기존의 ResNet 계열(ResNext, SE..
SENet : Squeeze-and-Excitation Networks ResNet에 residual block 이 있고, SENet에는 SE block이 있다. SE block 은 기존 네트워크의 feature map 을 재조정(recalibration) 하는 역할을 수행한다. 즉, feature map 의 전체 정보를 요약하고, 각 map의 중요도를 키워준다. 과정 1. Ftr : X -> U 을 수행하는 transformation 이 (H', W', C') 차원의 입력을 (H, W, C) 차원으로 바꿔서 출력한다. 2. Fsq 를 통해 출력 U의 각 채널 별 정보를 뽑아낸다. 3. Fex 를 통해 스칼라 가중치를 계산한다. 4. Fscale 을 통해 스칼라 가중치를 U 에 곱해준다. Ftr 단순한 ..
ResNet VGG 네트워크를 통해 네트워크 모델이 깊어질수록 성능이 좋아진다는 것을 확인했다. 하지만 깊이를 늘리는 데 한계가 있었고, VGG에서는 16-layer 이후 성능 향상이 거의 없었다. ResNet은 VGG보다 더 깊은 네트워크를 만들어도 성능의 향상을 가져오도록 하였다. 아래를 보면 기존에 사용하던 plain network와 ResNet을 적용한 네트워크를 비교할 수 있다. 입력 x를 출력에 더해서 H(x)=F(x)+x 의 F(x)를 학습시킨다. plain으로 학습했을 때는 34-layer가 18-layer보다 깊은데도 에러율이 더 높았다. ResNet을 적용한 후에는 더 깊은 네트워크가 에러율이 더 낮은 것을 확인할 수 있다. bottlenect resnet 연산 시간을 줄이는 방법이다...
Mask R-CNN Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick Facebook AI Research (FAIR) Mask R-CNN의 시작은 Faster rcnn으로 찾은 RoI에서, FCN을 이용하여 segmentation을 하자는 아이디어에서 시작되었다. Faster rcnn + FCN 의 아이디어 동작 순서 1. 이미지 전처리 1) 입력 이미지 resize (bilinear interpolation) 2) Backbone network의 입력 사이즈에 맞게 이미지 padding 2. Backbone 1) ResNet을 통해 여러 층의 feature map (C1, C2, C3, C4, C5) 생성 2) FPN을 통해 최종 feature map ..
본 글은 DEVIEW 2020의 '외국어가 읽힌다 딱! (파파고 이미지 번역)'을 정리한 글입니다. 외국어가 읽힌다 딱! 파파고 이미지 바로 번역 1. 이미지 번역 1.1 이미지 번역의 필요성 파파고를 이용하면 이미지의 외국어를 한국어로 번역할 수 있다. 번역 방법 : 사진에서 텍스트 영역 추출 → 추출한 영역을 문지르면 해당 부분을 번역 이미지 번역의 사용량과 분야가 점점 늘어나고 있다. 1.2 이미지 번역 과정 OCR(문자 검출 + 문자 인식) → 기계 번역(MT) ↓ ↓ ↓ OCR → 단어 그룹화 → 기계 번역 관련 단어를 묶고, 정렬하여 기계 번역기에 넣어야 한다. 기존에는 룰 기반의 알고리즘을 사용하여, 각 단어마다 자신이 어느 줄에 속하는 지 결정하여 문장을 만들었다. 기존의 한계 사용자가 문..
pixel_link의 github에 나와 있는 개발 환경은 다음과 같다. ubuntu 18.04 python 2.7 tensorflow 1.1.0 tensorflow-gpu 1.1.0 opencv 2.4.11 cudatoolkit 7.5 cudnn 5.1 나의 개발 환경 ubuntu 18.04 python 2.7 tensorflow 1.14.0 tensorflow-gpu 1.14.0 cuda 10.0 내가 해야할 것 tensorflow, tensorflow-gpu, cuda 다운 그레이드가 필요하다. 추가로 opencv를 설치해야한다. 1. tesorflow, tesorflow-gpu 설치 생각보다 쉬웠다. $ pip install tensorflow==1.1.0 $ pip install tensorfl..