- 회원들이 추천해주신 좋은 글들을 따로 모아놓는 공간입니다.
- 추천글은 매주 자문단의 투표로 선정됩니다.
Date 16/03/11 22:24:58
Name   Azurespace
Subject   알파고가 이겼군요.
한동안 딥 러닝에 대해서 글을 안 올렸는데, 졸업논문을 마치고 나니 입사 전까지 놀아야 한다는 사명감에 불타서 말이죠. 노느라 바빴습니다

그리고 회사에서는 임베디드 프로그래밍 해야 되는데 어차피 계속하지도 못할 딥러닝 보고 있어봐야 무슨 소용인가... 하는 마음도 있었고요.

음.. 알파고가 이겼더군요.
사실 작년 5월에 구글 딥마인드에서 냈던 두 개의 논문에 대해서 글을 쓴 적이 있었습니다.

고작 1년만에 알파고가 인간 최강계의 기사를 압살하는 모습을 보여주다니 신기할(은 공치사고 사실 그저 컴퓨팅 파워에 달려 있다고 예상은 한) 따름입니다.

http://pgr21.com/pb/pb.php?id=freedom&no=57937

알파고는 위 글에서 제가 설명했던, 정확히 저 두 알고리즘을 결합한 것입니다. 인간의 기보로 최소한의 룰을 빠르게 학습시키고, 승리와 패배에 대해 각각 reward를 줘서 Q러닝으로 강화학습한 것이지요.

컨볼루션 네트워크는 인간의 신경세포 구조를 본뜬 것인만큼, 아마도 인간의 직관과 같지는 않겠지만 특성은 비슷합니다. 제법 훌륭하게 작동하지만 어떤 원리로 작동하는지, 무엇을 근거로 판단하는지 근거를 알기는 어렵지요.

신경망을 알파고의 바둑 직관이라고 생각하고 보면...

자신의 직관을 통해 다음 수로 가장 적합한 위치라고 생각되는 곳에 돌을 둬 보고, 그에 따라 상대의 이어지는 수순을 따라서 머릿속으로 둬 보는 과정을 통해 가장 좋은 수가 무엇인지 찾는 것이지요.

이는 사실 프로 기사들이 하는 것과 크게 다르지 않습니다. 이렇게 생각하면 알파고는 가장 완벽한 인간답게 두는 기사인 셈입니다. 이세돌 9단이 대국 전 구글 딥마인드의 설명을 듣고 힘들수도 있겠다 생각했다는데, 인공지능을 잘 모르는 이 9단도 직감적으로 이해했던 것이 아닐까 싶습니다.

알파고의 기풍을 두고 절대 흔들리지 않는다. 소름끼친다고 하는데, 이는 알파고의 학습을 위해 세팅한 보상(reward)이 몇 집 승리인지는 고려하지 않고 상대보다 집이 많으면 되는 것으로 설정되어 있기 때문입니다. 때문에 매우 크게 이길 수 있는 경기라도, 그로 인해서 역전당할 가능성이 있다면 절대 두지 않고 적당한 선에서 손해를 감수해 주는 이창호 같은 모습이 나오게 되는 것입니다.

만약 리워드 함수에 상대와의 집 차이까지 반영이 되었었다면... 모르겠습니다. 어쩌면 지금보다도 더욱 처참할지도 모릅니다. 전성기는 지났다 하나 현세대 최강의 기사 중 한 명이 수십 집 차이로 박살나는 모습을 보게 될지도 모르니까요....


그나저나 제 자신이 썼던 댓글이 상당히 흥미롭군요.

http://pgr21.com/?b=8&n=57937&c=2196620

[학습은 사람끼리 한 기보로 시켰는데 AI를 상대로 시켰기 때문에 ...(중략)... 개인적으로는 요 신경망에다가 위의 Q러닝과 유전알고리즘 같은 전역최적화 알고리즘을 도입해서 지들끼리 두면서 발전하게 만들면 또 더 나은 성능의 인공지능을 만들 수 있을 것 같은데 하드웨어 성능이 문제로군요 흐흐;]

알파고가 사용한 방법과 정확하게 일치합니다.
솔직히 구글 저 무식한 놈들이 돈 써가면서 저렇게까지 할까 싶었는데 했네요. 흥, 난 돈 없어서 못했을 뿐이야.


저 글이 성지가 되고 추앙을 받아야 하는건데....

아니 저 댓글을 영어로 적어서 구글 딥마인드 눈에 들었어야 했는데...! 큿..!

* Toby님에 의해서 티타임 게시판으로부터 게시물 복사되었습니다 (2016-03-20 17:10)
* 관리사유 : 추천게시판으로 복사합니다.



11
  • 영어로 적었어야 했는데 ㅠㅠ
  • 이 분이 언제 알파고 관련글을 쓰시나 지금껏 기다리고 있었습니다.
  • 더 많은 관련 글이 보고 싶습니다! 욕심이지만요...
  • 춫천


목록
번호 제목 이름 날짜 조회 추천
169 IT/컴퓨터알파고가 이겼군요. 35 Azurespace 16/03/11 9953 11
297 IT/컴퓨터신경망 학습의 틀을 깨다, DFA 15 Azurespace 16/11/06 9678 10
319 IT/컴퓨터회귀신경망으로 만든 챗봇 11 Azurespace 16/12/07 10365 8
316 기타마, 얼굴만 봐도 알겠네! 너지! 26 Azurespace 16/11/29 10042 17
41 기타하고 싶은 일이 무언지 모르겠다는 그대에게 32 ArcanumToss 15/07/08 18972 3
953 일상/생각한국인이 생각하는 공동체와 영미(英美)인이 생각하는 공동체의 차이점 16 ar15Lover 20/05/01 5903 5
517 여행안나푸르나 기슭에 가본 이야기 (주의-사진많음) 6 aqua 17/09/23 7038 21
532 일상/생각울진 않을거 같습니다. 14 aqua 17/10/21 8041 57
551 일상/생각고3, 그 봄, 그 겨울 19 aqua 17/11/21 6904 47
179 IT/컴퓨터100점짜리 단어를 찾아서. 30 April_fool 16/04/05 11525 15
274 IT/컴퓨터컴퓨터는 어떻게 빠르게 검색을 할까 - 보이어-무어-호스풀 알고리즘 18 April_fool 16/10/04 14557 1
737 꿀팁/강좌지금 쓰는 안경에만 돈을 75만원씩 퍼부은 사람이 알려주는 안경 렌즈 선택의 거의 모든 것 22 April_fool 18/11/28 61824 52
749 의료/건강저의 정신과 병력에 대한 고백 15 April_fool 18/12/29 8692 47
770 체육/스포츠[사이클] 랜스 암스트롱 (1) - It's not about the bike. 12 AGuyWithGlasses 19/02/17 6178 9
966 일상/생각공부하다 심심해 쓰는 은행원의 넋두리 썰. 14 710. 20/06/06 5917 32
980 일상/생각40대 부부의 9급 공무원 도전기 36 4월이야기 20/07/08 7584 51
1000 일상/생각뉴스 안보고 1달 살아보기 결과 10 2020禁유튜브 20/08/18 6075 29
76 문화/예술goodbye. printmaking 18 1일3똥 15/09/24 9026 4
584 문화/예술프사 그려드립니다. 72 1일3똥 18/01/28 8613 24
114 꿀팁/강좌진지한 취미 사진가를 위한 다섯 가지 팁(스크롤 압박!) 43 *alchemist* 15/11/15 10127 14
458 일상/생각냥님 입양기 – 나는 어떻게 그를 만나게 되었는가 22 *alchemist* 17/06/27 6364 9
988 문화/예술지금까지 써본 카메라 이야기(#03) – Leica X2 (이미지 다량 포함) 12 *alchemist* 20/07/23 5147 7
1216 일상/생각기록하는 도구에 대한 욕망... (1) 25 *alchemist* 22/06/22 4111 18
1389 꿀팁/강좌[해석] 인스타 릴스 '사진찍는 꿀팁' 해석 24 *alchemist* 24/04/23 2432 16
815 경제바뀌지 않는 국책사업의 이면 5 쿠쿠z 19/06/11 5694 19
목록

+ : 최근 6시간내에 달린 댓글
+ : 최근 12시간내에 달린 댓글

댓글