- 새로운 뉴스를 올려주세요.
Date | 18/12/17 19:42:57수정됨 |
Name | April_fool |
Subject | ‘알파고’의 생물학판 ‘알파폴드’ 등장 |
<조선비즈> 바둑은 서막...‘알파고’ 생물학판 ‘알파 폴드’에 과학계 쇼크 http://biz.chosun.com/site/data/html_dir/2018/12/07/2018120702397.html <매일경제> 신약개발 속도 확 올릴 `알파폴드` 탄생 http://news.mk.co.kr/newsRead.php?year=2018&no=770683 <사이언스타임즈> ‘알파고’ 이어 ‘알파폴드’ 등장 https://www.sciencetimes.co.kr/?news=%EC%95%8C%ED%8C%8C%EA%B3%A0-%EC%9D%B4%EC%96%B4-%EC%95%8C%ED%8C%8C%ED%8F%B4%EB%93%9C-%EB%93%B1%EC%9E%A5 <BRIC> 구글 딥마인드의 최신병기 알파폴드(AlphaFold), 단백질의 3D 형태 예측 http://www.ibric.org/myboard/read.php?id=300218&Board=news 바둑 인공지능인 알파고(AlphaGo) 시리즈를 만들어서 세계적으로 큰 반향을 낳았던 구글의 딥마인드(DeepMind)팀이 알파폴드(AlphaFold)라고 하는 인공지능 프로그램을 개발하여 단백질 구조 예측에서 큰 성과를 거두었습니다. 단백질은 구조가 복잡하고 종류가 많은데, 단백질의 구조를 알아내는 것은 여러 가지 질병을 치료할 수 있는 중요한 단서로 이어지기 때문에 생물학에서 매우 중시하는 것입니다. 그리하여 국제적인 단백질 구조예측 경연대회가 주기적으로 열리는데, 여기서는 이미 과학자들이 구조를 밝혀내었지만 아직 공표되지 않은 단백질의 데이터를 받아서 제한된 시간 안에 어느 팀이 가장 정확한 단백질의 구조를 많이 밝히느냐를 겨루게 됩니다. 딥마인드의 수장 데미스 허사비스를 비롯한 팀은 여기에 출전하여, 인공지능 프로그램을 통해 단백질 43개 중 25개의 구조를 정확히 밝혀내는데 성공하여 대회 1위를 기록했습니다. 참고로 같은 대회에서 2위가 밝혀낸 단백질 구조 수는 고작 3개뿐입니다. 이에 대해 데미스 허사비스는 “우리는 이제 첫걸음을 내디뎠을 뿐이다.”라고 말했지만, 이것만으로도 대단한 성과라는 것은 부정할 수 없는 사실입니다. 알파고님 충성충성충성! 구글후 아크바르!! 1
이 게시판에 등록된 April_fool님의 최근 게시물
|
단백질 구조 아무리 밝혀봐야... 실제 기능하고 맞는 경우는 굉장히 적어서... 그리고 아무리 molecular pathway 밝혀봐야... 하루가 멀다하고 새로운 뒷 길이 나오고. 게다가 쥐한테 있는 것은 인간한테 없고 인간한테 있는 것은 쥐한태 없고... 게다가 이걸 딥마이닝으로 분석한들 똑같은 조건으로 실험해봐도 재현성이 30~40프로밖에 안되는 바닥이라.
메타아날라이시스에서 유명한 말 중에 가비지인 가비지아웃이라는 말이 있요. 아무리 좋은 툴이 있어서 마구 집어넣어봤자 결과는 꽝이라는 이야기지요. 머신 러닝도 아직까지... 더 보기
메타아날라이시스에서 유명한 말 중에 가비지인 가비지아웃이라는 말이 있요. 아무리 좋은 툴이 있어서 마구 집어넣어봤자 결과는 꽝이라는 이야기지요. 머신 러닝도 아직까지... 더 보기
단백질 구조 아무리 밝혀봐야... 실제 기능하고 맞는 경우는 굉장히 적어서... 그리고 아무리 molecular pathway 밝혀봐야... 하루가 멀다하고 새로운 뒷 길이 나오고. 게다가 쥐한테 있는 것은 인간한테 없고 인간한테 있는 것은 쥐한태 없고... 게다가 이걸 딥마이닝으로 분석한들 똑같은 조건으로 실험해봐도 재현성이 30~40프로밖에 안되는 바닥이라.
메타아날라이시스에서 유명한 말 중에 가비지인 가비지아웃이라는 말이 있요. 아무리 좋은 툴이 있어서 마구 집어넣어봤자 결과는 꽝이라는 이야기지요. 머신 러닝도 아직까지는 이 분야에서는 그닥 효용이 없어요.
머신 러닝 기본 개념 자체가 'prediction'이지 'casuality'가 아닙니다. 저 툴도 단백질 구조 'prediction'이지, 우리 몸의 어떤 현상의 'casuality'가 아닙니다.
그래도 충성충성 알파고. 언젠가 해내실 거라 믿읍니다 ^^7
메타아날라이시스에서 유명한 말 중에 가비지인 가비지아웃이라는 말이 있요. 아무리 좋은 툴이 있어서 마구 집어넣어봤자 결과는 꽝이라는 이야기지요. 머신 러닝도 아직까지는 이 분야에서는 그닥 효용이 없어요.
머신 러닝 기본 개념 자체가 'prediction'이지 'casuality'가 아닙니다. 저 툴도 단백질 구조 'prediction'이지, 우리 몸의 어떤 현상의 'casuality'가 아닙니다.
그래도 충성충성 알파고. 언젠가 해내실 거라 믿읍니다 ^^7
알파고와 비교하는 것도 이상한 것은 아니라고 봅니다. 바둑 인공지능에서 기존의 방법론으로는 다음 수를 탐색해야 할 양이 너무 많아서 수행시간과 결과물의 품질(다음 한 수)이 후달렸는데, 알파고에서는 최신 방법론을 도입해서 다음 수의 후보범위를 획기적으로 줄이는 방식으로 짧은 시간으로 대단히 뛰어난 품질의 결과물을 얻어내는데 성공합니다. 지금 이 “알파폴드” 또한 제가 이해하기로는 알파고의 방법론과 유사하게 아미노산이 접힌 3차원 구조의 가능한 후보범위를 최대한 줄이는 방식으로 퍼포먼스를 높인 것 같은데, 그렇다면 당연히 알파고와 유사하다는 이야기가 나올 수밖에 없지요. 왜냐하면 작동 얼개가 유사점이 많으니까 말이죠.
저와 보는 관점이 좀 달라서 그런거 같아요. 저는 알고리듬이 알파고와 유사하냐 아니냐보다는 알파고라는 어휘를 사용함으로써 대중에게 주는 효과에 좀 더 집중을 했거든요. 대중들이 알파고에 느끼는 감정같나 생각같은건 인간과 기계의 대결이라는 측면이 더 강하다고 생각해요. 근데 저 기사에서 알파고라고 이야기를 함으로서 기계와 인간의 관계가 아닌 알고리듬간의 대결을 기계와 인간의 대결로 반응을 하게되요.
그리고 과학계 자체에서는 굳이 쇼크라고 할것도 아닌게 새로운 알고리듬이 하나 더 더해진거고요. 실험적으로 결정된 구조라는것도 결국에는 optimization문제라는것도 있고요.
그리고 과학계 자체에서는 굳이 쇼크라고 할것도 아닌게 새로운 알고리듬이 하나 더 더해진거고요. 실험적으로 결정된 구조라는것도 결국에는 optimization문제라는것도 있고요.
음.. 아시겠지만 optimization 문제를 풀기 위해 gradient descent 등 다양한 방법론이 있지만 local minima에 빠지지 않으려면 이게 초기해가 얼마나 유망한 녀석을 잡느냐가 대단히 중요하지요. 초기해에 따라 수렴 결과와 수렴 시간이 달라지니까요. 그래서 꽤나 효율이 좋은 초기해를 잡기 위한 휴리스틱적인 튜닝방법만도 논문이 되곤 합니다. 제가 단백질 폴딩은 잘 모르지만 optimization 문제니까 큰 틀이 비슷할 것으로 생각하고요. 그래서 상당히 성능 좋은 초기해를 찾아내는 휴리스틱을, 그러나 인간의 도움 없이 신경망에 대한 기계학습만을 통해 찾아낸다라는 것은 쇼크까지는 아니어도 상당히 센서이셔널하지 않나 싶습니다. 단백질 폴딩뿐만 아니라 꽤 많은 NP-complete, NP-Hard 문제에 대한 중요한 힌트가 될 것 같아요.
말씀하신 부분은 다 알고 있는 부분들이기는 해요. 아...NP관련해서 어떤 힌트가 될수 있을지에 대해서는 잘 모르겠습니다.
저도 오래전에 곁눈질로만 본 것들이래서 아주 자세한건 모르고, 그냥 CASP13의 초록이 인터넷에 있어서 좀 읽어봤는데요. 사실 과학계의 쇼크니 뭐니라는 말을 할만한게 뭐가 있는지 잘 모르겠어요. 당연한 이야기지만 대부분은 기존의 방법론을 따르고 초기 스코어링 시스템을 사용하는게 있는데요. 이게 보토 단백질 구조 예측을 위한 에너지 함수의 각종 파라메타를 구하는 방법중에 하나의 방법이기는 하거든요. ab initio로 구하는 방법도 있고 기존의 자료를 이용해서 paramete... 더 보기
저도 오래전에 곁눈질로만 본 것들이래서 아주 자세한건 모르고, 그냥 CASP13의 초록이 인터넷에 있어서 좀 읽어봤는데요. 사실 과학계의 쇼크니 뭐니라는 말을 할만한게 뭐가 있는지 잘 모르겠어요. 당연한 이야기지만 대부분은 기존의 방법론을 따르고 초기 스코어링 시스템을 사용하는게 있는데요. 이게 보토 단백질 구조 예측을 위한 에너지 함수의 각종 파라메타를 구하는 방법중에 하나의 방법이기는 하거든요. ab initio로 구하는 방법도 있고 기존의 자료를 이용해서 paramete... 더 보기
말씀하신 부분은 다 알고 있는 부분들이기는 해요. 아...NP관련해서 어떤 힌트가 될수 있을지에 대해서는 잘 모르겠습니다.
저도 오래전에 곁눈질로만 본 것들이래서 아주 자세한건 모르고, 그냥 CASP13의 초록이 인터넷에 있어서 좀 읽어봤는데요. 사실 과학계의 쇼크니 뭐니라는 말을 할만한게 뭐가 있는지 잘 모르겠어요. 당연한 이야기지만 대부분은 기존의 방법론을 따르고 초기 스코어링 시스템을 사용하는게 있는데요. 이게 보토 단백질 구조 예측을 위한 에너지 함수의 각종 파라메타를 구하는 방법중에 하나의 방법이기는 하거든요. ab initio로 구하는 방법도 있고 기존의 자료를 이용해서 parameter를 추출해내기도 하고요.
초록은 아래에서 보실 수 있어요. 11페이지에 있네요.
http://predictioncenter.org/casp13/doc/CASP13_Abstracts.pdf
저도 오래전에 곁눈질로만 본 것들이래서 아주 자세한건 모르고, 그냥 CASP13의 초록이 인터넷에 있어서 좀 읽어봤는데요. 사실 과학계의 쇼크니 뭐니라는 말을 할만한게 뭐가 있는지 잘 모르겠어요. 당연한 이야기지만 대부분은 기존의 방법론을 따르고 초기 스코어링 시스템을 사용하는게 있는데요. 이게 보토 단백질 구조 예측을 위한 에너지 함수의 각종 파라메타를 구하는 방법중에 하나의 방법이기는 하거든요. ab initio로 구하는 방법도 있고 기존의 자료를 이용해서 parameter를 추출해내기도 하고요.
초록은 아래에서 보실 수 있어요. 11페이지에 있네요.
http://predictioncenter.org/casp13/doc/CASP13_Abstracts.pdf
알파고에 사용된 MCTS나 Q learning도 방법론 자체는 수십년 전으로 거슬러올라가야 합니다. 그걸 실제 단시간에 활용가능한 수준으로 끌어올리는 게 breakthrough 아니겠습니까.
목록 |
|