- 회원들이 추천해주신 좋은 글들을 따로 모아놓는 공간입니다.
- 추천글은 매주 자문단의 투표로 선정됩니다.
Date 15/09/30 01:03:41
Name   Azurespace
Subject   사실 구글은 스카이넷을 만들고 있습니다
http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Vinyals_Show_and_Tell_2015_CVPR_paper.pdf

이번 글의 소재는 올해 CVPR에 제출된 논문입니다.

구글 오픈딥 소속 연구자들이 내어 놓은 건데, 논문 전면의 이름값들이 후덜덜합니다.

그리고 이름값에 부족하지 않을 정도로 후덜덜한 연구 내용입니다.



논문의 초록에서도 밝히고 있습니다만, Image Caption Generating이라는 분야는 상당히 중요합니다. Computer Vision과 Natural Language Processing를 연결하는 교두보이면서 동시에 각 분야의 아주 원천적인 기술을 요구하기 때문입니다.


이들이 풀려고 시도한 문제 자체는 심플합니다. "컴퓨터에게 어떤 사진을 보여주고, 사진의 내용을 영어(자연어)로 설명해 보라고 하는 것" 이죠.

문제가 심플하다고 해서 해법 또한 심플한 경우는 별로 없습니다.
말이야 쉽지만, 사실 이 문제는 여러 작은 문제들로 나뉘게 됩니다.

첫째로 주어진 사진으로부터 사진 속에 등장하는 오브젝트들의 정체를 가려내는 것.
둘째로 각 오브젝트 사이의 관계를 구해내는 것
셋째로 그 관계성을 어색하지 않은 인간의 언어로 풀어내는 것.


이 문제들 각각이 결코 쉬운 것이 아닙니다. 하지만 구글 아닙니까?



원래 이미지에서 뭔가를 인식하거나 하는 용도로는 Convolutional Neural Network란 걸 주로 씁니다. 왜 이미지 인식에서 CNN이 성능이 좋은가 하는 것도 상당히 흥미로운 주제입니다만, 수식이 안 나올래야 안 나올 수도 없고 그렇게 설명하려고 해도 쉽지 않을 것이니(저는 파인만이 아니에요!), 일단은 얘가 사람의 시세포들이 적당히 뭉쳐 있는 것과 약간 비슷한 연결구조를 가진다, 그래서 이미지 인식에 성능이 좋다. 정도로 이해하시면 됩니다.


그리고 자연 언어 처리, 예를 들어서 영어를 프랑스어로 바꾼다던지, 단어들을 벡터 공간에 매핑한다던지 하는 식의 문제에는 보통 Long Short Term Memory(LSTM)이라고 불리는 재귀 신경망(Recurrent Neural Network)을 사용합니다. CNN 같은 신경망은 한쪽 방향으로만 연결이 존재하는데, RNN들은 반대방향으로도 연결이 존재할 수 있어서 보다 복잡한 처리를 할 수 있게 되거든요.



아무튼 이 연구진들에게는...

1. 이미지 분류에 사용하기 위한 CNN이 있고,
2. 자연어 처리에 사용하기 위한 RNN 또한 있었습니다.


그래서 이 연구자들이 한 짓이 뭔가 하면,

1의 CNN의 마지막 계층을 떼어내고,
2의 RNN 맨 앞 계층에다가 가져다 붙였습니다.


상상해 보세요. 웬 미친 과학자놈들이 머리통에서 뇌를 꺼내다가 다른 뇌 옆에다가 척하고 놓더니 전선으로 여기저기를 마구 연결하기 시작하는 거에요. 어후...

물론 뭐 논리적으로만 존재하는 가상의 신경망이기에 고통을 느낀다거나 거부반응에 끔살을 당한다거나 하지는 않았습니다만...


그리고는 뭐 자기네가 들고 있는 데이터 세트를 거기다가 다시 학습시키는 거에요.
이 데이터 세트는 어떻게 만들었냐면, 사진을 주면 사람이 그 사진의 내용에 대해서 설명하는 영어 문장을 만들어요. 그렇게 수천장 수만장을 반복했기 때문에... 아무튼 똑똑한 사람들이니 좋은 사진과 설명을 사용했겠지요.


이렇게 만들어진 신경망은 비록 사람을 이기는 정도는 아니었지만 기존에 이미지 캡션에 사용되었던 수많은 방법들을 전부 다 격파하는 데 성공했다는 말씀.

[http://i.imgur.com/VIRixJM.jpg]


근데 비교대상이 나였으면 쟤가 이겼을 것 같은데... 영어가 짧아서. 으음....


* 난커피가더좋아님에 의해서 자유 게시판으로부터 게시물 복사되었습니다 (2015-10-08 08:35)
* 관리사유 : 추천게시판으로 복사합니다.



4


    목록
    번호 제목 이름 날짜 조회 추천
    815 경제바뀌지 않는 국책사업의 이면 5 쿠쿠z 19/06/11 5092 19
    114 꿀팁/강좌진지한 취미 사진가를 위한 다섯 가지 팁(스크롤 압박!) 43 *alchemist* 15/11/15 9300 14
    458 일상/생각냥님 입양기 – 나는 어떻게 그를 만나게 되었는가 22 *alchemist* 17/06/27 5680 9
    988 문화/예술지금까지 써본 카메라 이야기(#03) – Leica X2 (이미지 다량 포함) 12 *alchemist* 20/07/23 4351 7
    1216 일상/생각기록하는 도구에 대한 욕망... (1) 25 *alchemist* 22/06/22 3422 18
    76 문화/예술goodbye. printmaking 18 1일3똥 15/09/24 8445 4
    584 문화/예술프사 그려드립니다. 72 1일3똥 18/01/28 8029 24
    1000 일상/생각뉴스 안보고 1달 살아보기 결과 10 2020禁유튜브 20/08/18 5558 29
    980 일상/생각40대 부부의 9급 공무원 도전기 36 4월이야기 20/07/08 6864 51
    966 일상/생각공부하다 심심해 쓰는 은행원의 넋두리 썰. 14 710. 20/06/06 5348 32
    770 체육/스포츠[사이클] 랜스 암스트롱 (1) - It's not about the bike. 12 AGuyWithGlasses(산타는옴닉) 19/02/17 5493 9
    179 IT/컴퓨터100점짜리 단어를 찾아서. 30 April_fool 16/04/05 10434 15
    274 IT/컴퓨터컴퓨터는 어떻게 빠르게 검색을 할까 - 보이어-무어-호스풀 알고리즘 18 April_fool 16/10/04 13647 1
    737 꿀팁/강좌지금 쓰는 안경에만 돈을 75만원씩 퍼부은 사람이 알려주는 안경 렌즈 선택의 거의 모든 것 22 April_fool 18/11/28 57820 52
    749 의료/건강저의 정신과 병력에 대한 고백 15 April_fool 18/12/29 7993 47
    517 여행안나푸르나 기슭에 가본 이야기 (주의-사진많음) 6 aqua 17/09/23 6560 21
    532 일상/생각울진 않을거 같습니다. 14 aqua 17/10/21 7465 57
    551 일상/생각고3, 그 봄, 그 겨울 19 aqua 17/11/21 6198 47
    953 일상/생각한국인이 생각하는 공동체와 영미(英美)인이 생각하는 공동체의 차이점 16 ar15Lover 20/05/01 5241 5
    41 기타하고 싶은 일이 무언지 모르겠다는 그대에게 32 ArcanumToss 15/07/08 18185 3
    4 게임[히어로즈] 이것만 알면 원숭이도 1인분은 한다 64 Azurespace 15/05/30 12654 76
    67 IT/컴퓨터[약혐?] 안드로이드는 전자 양의 꿈을 꾼다 10 Azurespace 15/09/07 10636 9
    69 IT/컴퓨터거장의 그림을 30초만에 만들다: DeepStyle 33 Azurespace 15/09/08 31238 10
    71 IT/컴퓨터스타트랙 신경망 8 Azurespace 15/09/16 7852 5
    79 IT/컴퓨터사실 구글은 스카이넷을 만들고 있습니다 16 Azurespace 15/09/30 9281 4
    목록

    + : 최근 6시간내에 달린 댓글
    + : 최근 12시간내에 달린 댓글

    댓글