홍차넷 - 신경망 학습의 틀을 깨다, DFA

티타임

- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.

선비

16/11/06 11:20

주소복사

우와 정말 데단해~

April_fool

16/11/06 11:44

주소복사

근래에 레이 커즈와일이 쓴 <마음의 탄생>을 읽으면서 [계층적 은닉마르코프모형](HHMM)을 설명하는 것을 보고 오~ 했는데, 사실 지금까지 개발된 인공신경망 기술은 어쩌면 빙산의 일각일지도 모르겠네요. 미래에 인공신경망 기술이 발전한 뒤에 지금을 바라보면 ‘그 쉬운 정답을 찾지 못해 헤메던 격동기’로 평가되려나요?

레지엔

16/11/06 11:48

주소복사

AI 관련된 얘기가 계속 나오면서 학습에 대해서 혼자 공부하는데 이건 음... 이 자체가 과연 사람이 이해할 수 있는 영역인가 하는 회의가 들었습니다. 나만 이해못하는 걸 수도 있는데 각각 다른 전공에서 출발한 사람들이 서로 합의 모델 도출도 잘 안되는걸 보면... 아 그냥 편하게 돈이나 벌고 싶다...-_-;

Azurespace

16/11/07 23:47

주소복사

신경망 네트워크의 동작 방식에 대해선 많은 사람들의 연구 덕분에 이제 어느 정도 청사진 정도는 그려볼 수는 있는 정도는 되었습니다. 언젠가 관련된 글을 또 쓸 기회가 있겠지요.

세계구조

16/11/06 11:52

주소복사

하아... 쉬운 설명 고맙습니다...

불타는밀밭

16/11/06 12:26

주소복사

언젠가는 컴퓨터에게 '야, 너 골드바흐의 추측좀 증명해봐.'

이런거 맡길 수 잇을려나요.

DoubleYellowDot

16/11/06 13:57

주소복사

이해는 어렵지만 항상 흥미로워서 기다리고 있었습니다

Ben사랑

16/11/06 15:23

주소복사

좋은 정보글 감사합니다.
제가 관심은 있지만 인공지능, 신경망 등등에 대해 잘 모르기 때문에(너가 아는 것은 도대체 뭐냐? ..)
꽤 시간을 들여서 이해하려고 노트필기를 했습니다. 위와 같이 이해하는 것이 맞나요?

노트필기한 그림파일을 설명하자면,

1) Back-propagation방식은,
x가 입력되었을시에 Y_real과 Y_pred의 차이를 error(즉, loss function)로 정의하고, 그 loss function을 편미분하여 그것의 gradient를 구한다. 그 gradient는 W_i들(다중 레이어의 신경망이 가지는 각각의 가중치 벡터들)이 error에 기여하는 정도를 의미하게 된다.
학습될 인공 신경망에 대해,
결과값을 알기 위해서는 앞쪽(input, 즉 x쪽에 가까운) 신경망 레이어에서 뒤쪽(output, 즉 Y쪽에 가까운) 신경망 레이어로 신호를 보내야 하고,
gradient를 알기 위해서는 그 반대쪽 방향으로 W_i의 transpose들을 사용하여 앞뒤 신경망 레이어들 사이에서 피드백이 이루어져야 한다.

2) Feedback Alignment 방식은,
학습될 인공 신경망에 대해,
결과값을 알기 위해서는 ..(이하동문)...야 하고,
gradient 대신에 그 어떠한 아무렇게나 초기화된 matrix를 써도 그 반대쪽 방향으로 앞뒤 신경망 레이어들 사이에서 피드백이 이루어질 수 있다.
이것은 신기하긴 하지만 1)의 방식에 대해서 그 computation하는 횟수가 줄어들지 않기 때문에 학자들 사이에서 별 반향을 얻지 못했다.

3) Direct Feedback Alignment 방식은,
학습될 인공 신경망에 대해,
결과값을 알기 위해서는 ..(이하동문)..야 하고,
gradient 대신에 error에다가 아무런 random matrix 여럿 곱해서 얻은 것을 바로 직접 써도, "앞뒤 신경망들 사이에서 피드백을 할 필요 없이(!)", 각각의 computing node들을 개별적으로 학습시킬 수 있다. 이로써 훨씬 크고 깊은 네트워크도 빠르고 정확하게 학습할 수 있게 된 길이 열린 것이다.
다만, 앞선 가중치(학습)을 keep해서 뒤의 가중치(학습)에 가져가서 활용할 가치가 충분히 있을시에는 3)의 방식이 1)이 방식보다 비효율적이 된다.

* error는 각 신경망의 가중치들 W_i들과 그것의 transpose들을 고려한 weighted sum이다.

...이렇게 생각해도 될까요? 아주 오랜 시간을 들여서 제 뇌내망상을 결합해서 이렇게 이해해봤습니다.

Azurespace

16/11/06 16:53

주소복사

일단 BP FA DFA에 대한 얘기는 큰 틀에서 맞게 이해하신 것 같은데, error 부분이 조금 갸우뚱하게 되네요. 으음..

다음 페이지에 좋은 material이 있으니 조금 보시는 것도 괜찮을 것 같아요

http://hunkim.github.io/ml/

Ben사랑

16/11/06 17:00

주소복사

error를 하나의 스칼라값에 비유하여 2차원 그래프에 도시하여 이해했는데, 그다지 권할 만하지 않는 이해방식인가요?

링크해주신 material은 두고두고 정말 감사히 보겠습니다. 고맙습니다^^

기아트윈스

16/11/06 16:45

주소복사

오. 대단히 흥미로운 이야기네요 (뭔지 모르겠으니 일단 아는척을 하자)

레코드

16/11/07 19:03

주소복사

좋은 글 잘 보고 있습니다. 이번 글도 엄청 재미있네요... 이거 읽고 어디가서 딥러닝에 대해 아는 척 좀 해봐야겠네요;;

어서 스타2 인공지능 매치가 성사되어야 새로 읽을 거리가 풍부해질텐데... 어서 그날이 오면 좋겠네요.

번호	제목	이름	날짜	조회	추천
4189	IT/컴퓨터웹 상에서 작성하는 수학기호 - MathML 7	Toby	16/11/19	8260	3
4164	IT/컴퓨터구글, 신경망 기반 번역 기능 공개 20	Leeka	16/11/16	5524	5
4109	IT/컴퓨터실망스러운 맥북프로 신형.. 11	Leeka	16/11/08	5995	0
4094	IT/컴퓨터신경망 학습의 틀을 깨다, DFA 12	Azurespace	16/11/06	7768	8
4081	IT/컴퓨터애플이 3분기 스마트폰 영업이익 점유율 신기록을 달성했습니다 15	Leeka	16/11/04	3575	0
4073	IT/컴퓨터국내 데스크탑 브라우저 점유율 36	Toby	16/11/03	5096	2
4058	IT/컴퓨터아이폰7 등장과 함께 사라진 V20 3	Leeka	16/11/02	3734	0
4026	IT/컴퓨터맥북 프로 신형이 공개되었습니다. 9	Leeka	16/10/28	3696	0
3993	IT/컴퓨터양띵도 탈 아프리카를 선언했습니다. 14	Leeka	16/10/23	4236	0
3988	IT/컴퓨터아이폰7 사용 이틀 뒤 후기들 5	Leeka	16/10/23	4379	0
3982	IT/컴퓨터아이폰 7, 출시 첫날 30만대 이상 개통된것으로 보여.. 6	Leeka	16/10/21	4295	0
3981	IT/컴퓨터퍼즐 맞추기, DNA sequencing 7	JUFAFA	16/10/21	4626	2
3948	IT/컴퓨터역대 아이폰 시리즈의 슬로건 4	Leeka	16/10/19	6763	0
3947	IT/컴퓨터유쁠 매장에서 아이폰7 수령해왔습니다. 20	Leeka	16/10/18	5082	0
3941	IT/컴퓨터갤노트7 해외여행 대책이 공개되었습니다 2	Leeka	16/10/18	3936	0
3924	IT/컴퓨터아름다움이 적을 이기느니라 4	신문안사요	16/10/15	4882	0
3908	IT/컴퓨터아재형 아가씨에게 3g 폴더폰 넘기란 말이다!!!!!! (멱살멱살) 26	진준	16/10/14	4540	0
3898	IT/컴퓨터이원복 KTL 원장 "갤노트7 발화원인 검증 경솔했다" 12	Leeka	16/10/13	4313	0
3888	IT/컴퓨터아이폰이 다음주면 한국에 나옵니다. 3	Leeka	16/10/13	4063	0
3854	IT/컴퓨터송도 버거킹, 대전 한화 이글스파크에서 노트7이 발화했습니다 6	Leeka	16/10/09	4037	0
3851	IT/컴퓨터미국에서 통신사발 갤노트7 교환이 시작되었습니다. 3	Leeka	16/10/08	4597	0
3820	IT/컴퓨터컴퓨터는 어떻게 빠르게 검색을 할까 - 보이어-무어-호스풀 알고리즘 18	April_fool	16/10/04	6274	7
3785	IT/컴퓨터애플이 본격적인 한국 공략을 준비하는거 같습니다. 3	Leeka	16/09/27	4619	0
3756	IT/컴퓨터북한 도메인을 사용하는 사이트들 5	Toby	16/09/23	4078	0
3754	IT/컴퓨터스마트 모빌리티 이야기 (4) 5	기쁨평안	16/09/22	4011	0

+ : 최근 2시간내에 달린 댓글
+ : 최근 4시간내에 달린 댓글

Date	16/11/06 11:15:53수정됨
Name	Azurespace
Subject	신경망 학습의 틀을 깨다, DFA
https://kongcha.net/free/4094 작성자가 본문을 삭제한 글입니다. 8 이 게시판에 등록된 Azurespace님의 최근 게시물 18-03-21 팬의 죽음을 알게 된 지하 아이돌의 일기 [6] 17-01-07 두 대의 구글 챗봇이 대화하는 채널 [12] 16-12-07 회귀신경망으로 만든 챗봇 [11] 16-11-29 마, 얼굴만 봐도 알겠네! 너지! [24] 16-11-06 신경망 학습의 틀을 깨다, DFA [12] 16-07-05 fMRI 관련 연구에 핵폭탄이 터졌습니다. [28] 16-07-04 테슬라 자동운전(Autopilot) 모드에서 운전자 사망 [20] 16-05-27 이 나라의 공직기강 해이는 어디까지 갈 것인가 [13] 16-03-31 마이크로소프트의 충격적인 발표 [21] 16-03-13 알파고의 약점이란 [31]