- 작성자가 질문을 받을 수 있는 게시판입니다.
- AMA는 Ask me anything (무엇이든 물어보세요)라는 뜻입니다.
Date | 20/08/07 16:38:04 |
Name | [익명] |
Subject | 딥러닝 대회 3회 수상한 대학원생이 AMA 남깁니다 |
작성자 이력 - 크고 작은 딥러닝 대회에서 대상, 2등, 3등 골고루 수상했습니다. - SW 회사에서 잠깐 일했었고, 지금은 박사과정입니다. - 취직하긴 싫고, 창업하자니 고민인 상황 지금 하고 있는 것 - 제 발표자료나 유튜브 영상을 보고 걸려오는 딥러닝 모델개발 외주 - 공공기관과 딥러닝 SW 개발 R&D 지금 안하고 있는 것 - 논문 쓰기 - 지도교수님과 친하게 지내기 앞으로 어찌 살아야하나 고민만 가득합니다. 많은 질문 해주세요. 0
|
분야가 하도 빨리 바뀌고, 눈과 귀를 닫고 3개월이면 이미 트렌드와 동떨어지다보니 쉴새없이 공부해야합니다...
학습능력이 부족한 저로써는 이 분야에 있는 한 꿀빨기는 어렵겠네요...
왠만한 개발은 외주 맡기는 정출연이 그나마 맘편히 있을거 같습니다
학습능력이 부족한 저로써는 이 분야에 있는 한 꿀빨기는 어렵겠네요...
왠만한 개발은 외주 맡기는 정출연이 그나마 맘편히 있을거 같습니다
해외 취업 자체에 관심없는 게 아니라면 저도 고민해보라 말씀드리고 싶네요 ㅋㅋ 박사졸 연봉이 정말 엄청납니다...
1번이 고민해보시고 해결해야할 문제고
2번 영어는 완벽할 필요 없고 일을 주제로 소통할 수 있으면 됩니다.
3번 이건 회사들과 인터뷰를 보시면 알 수 있을 거 같아요. 능력이 되는지 안되는지는 회사가 판단해 줄거예요.
1번이 고민해보시고 해결해야할 문제고
2번 영어는 완벽할 필요 없고 일을 주제로 소통할 수 있으면 됩니다.
3번 이건 회사들과 인터뷰를 보시면 알 수 있을 거 같아요. 능력이 되는지 안되는지는 회사가 판단해 줄거예요.
제가 sung kim 님의 모두를 위한 딥러닝을 처음 접한게 2017년 하반기 였어요. 강의내용과 튜토리얼을 떼고나서는 2017년 말부터 제 도메인 쪽의 데이터로 실제 모델개발을 시작했고, 성능이 잘 안나오니까 그때부터는 다음과 같은걸 시도했고 지금도 하고 있어요
1. ai 뉴스레터 구독
2. 페이스북 tensorflow kr, pytorch kr 등 그룹 등록
3. 신규 모델이나 기법이 등장하면 github 예제 클론해서 내 모델에 적용해보기
결국 코드는 보는게 아니라 두드려야 내 것이 되는거 같아요
그리고 워낙 새로운게 툭툭 터져나오는 분야다보니 계속 배우지 않으면 밀리는 체감이 엄청납니다
1. ai 뉴스레터 구독
2. 페이스북 tensorflow kr, pytorch kr 등 그룹 등록
3. 신규 모델이나 기법이 등장하면 github 예제 클론해서 내 모델에 적용해보기
결국 코드는 보는게 아니라 두드려야 내 것이 되는거 같아요
그리고 워낙 새로운게 툭툭 터져나오는 분야다보니 계속 배우지 않으면 밀리는 체감이 엄청납니다
위에 오르토모 님께 남긴 댓글에 더해서 말씀드리면,
4. 딥러닝 연구를 100%으로 하자면, 데이터 50% 학습설계 30% 에러분석 10% 모델설계 10% 정도로 생각합니다
결국 데이터가 가장 크리티컬해서... 튜토리얼만 벗어나도 정갈한 데이터셋이 없으니 데이터 분석에 많은 시간과 노가다를 때려 박았습니다
5. 그러다보면 DB도 하게되고, 속도가 느리니 GPU 분산처리도 하게 되고, 도커나 쿠버네티스 까지도 손대게 되는 악순환에 빠지게 됩니다
6. 허우적대다보면 = 몬스터화이트 마시고 머리카락도 쥐어 뜯다보면 노하우도 생기고 대충 뭔지 감도 오고 ... 이렇게 무식하게 해오고 있습니다
4. 딥러닝 연구를 100%으로 하자면, 데이터 50% 학습설계 30% 에러분석 10% 모델설계 10% 정도로 생각합니다
결국 데이터가 가장 크리티컬해서... 튜토리얼만 벗어나도 정갈한 데이터셋이 없으니 데이터 분석에 많은 시간과 노가다를 때려 박았습니다
5. 그러다보면 DB도 하게되고, 속도가 느리니 GPU 분산처리도 하게 되고, 도커나 쿠버네티스 까지도 손대게 되는 악순환에 빠지게 됩니다
6. 허우적대다보면 = 몬스터화이트 마시고 머리카락도 쥐어 뜯다보면 노하우도 생기고 대충 뭔지 감도 오고 ... 이렇게 무식하게 해오고 있습니다
네, 요즘 딥러닝과 ai는 혼용해서 쓰는 것 같습니다
저와 주변의 연구동료들이 진로선택시 가장 신경쓰는 것은 1. 국제적 인지도가 높은 연구그룹 = 동료 연구자의 퀄리티, 2. 페이, 3. 안정성 순이더라구요
국내의 인재들이 외국에 나가는건 훌륭한 동료들과 일하고 싶은 마음이 크다고 생각해요
우리나라에서도 외국의 훌륭한 인재들을 영입해오는 것이 장기적으로는 큰 도움이 될거라 생각합니다 (코로나 이후로 한국의 사회안전망이 재평가 받기도 했구요)
외국 인재들이 국내에서 일하기 위한 서류절차나 비자 그리고 부동산 등에 대한 일체의 과정이 복잡하다는 것이 현실적 문제이지 싶습니다. 이걸 해결해주는게 가장 체감이 큰 지원책일거 같아요
저와 주변의 연구동료들이 진로선택시 가장 신경쓰는 것은 1. 국제적 인지도가 높은 연구그룹 = 동료 연구자의 퀄리티, 2. 페이, 3. 안정성 순이더라구요
국내의 인재들이 외국에 나가는건 훌륭한 동료들과 일하고 싶은 마음이 크다고 생각해요
우리나라에서도 외국의 훌륭한 인재들을 영입해오는 것이 장기적으로는 큰 도움이 될거라 생각합니다 (코로나 이후로 한국의 사회안전망이 재평가 받기도 했구요)
외국 인재들이 국내에서 일하기 위한 서류절차나 비자 그리고 부동산 등에 대한 일체의 과정이 복잡하다는 것이 현실적 문제이지 싶습니다. 이걸 해결해주는게 가장 체감이 큰 지원책일거 같아요
인공지능에 대해서 이해가 안가는것이 있는데요..
어떠한 수치와 조건을 줘서 모델을 만든이후 임의의 데이터를 모델 학습을 통해 예측하는데 이게 수동적으로 조건식으로 해도 상관없지 않나요?
저는 이게 이해가 안갑니다 이미 인공지능에게 정답을 다알려줘놓고 무엇을 예측하는건지?
예를들어 비 예보를 예측하는 모델을 만드려고 과거 비가 오기 하루 전날들에 습도, 온도, 기압 데이터들을 바탕으로 모델을 만든 뒤 오늘의 습도, 온도, 기압을 기계에게 알려주면 내일 비가올지 안올지를 알려주잖아요… 이걸 “예측”이라고 정의할 수 있는지가 의문입니다…
이런건 단순 조건문으로도 만들 수 있는거 아닙니까? 저가 잘못이해한걸 알려주십시오!
어떠한 수치와 조건을 줘서 모델을 만든이후 임의의 데이터를 모델 학습을 통해 예측하는데 이게 수동적으로 조건식으로 해도 상관없지 않나요?
저는 이게 이해가 안갑니다 이미 인공지능에게 정답을 다알려줘놓고 무엇을 예측하는건지?
예를들어 비 예보를 예측하는 모델을 만드려고 과거 비가 오기 하루 전날들에 습도, 온도, 기압 데이터들을 바탕으로 모델을 만든 뒤 오늘의 습도, 온도, 기압을 기계에게 알려주면 내일 비가올지 안올지를 알려주잖아요… 이걸 “예측”이라고 정의할 수 있는지가 의문입니다…
이런건 단순 조건문으로도 만들 수 있는거 아닙니까? 저가 잘못이해한걸 알려주십시오!
확실히 이미지나 자연어는 고인물 판이 되었죠. 이쪽은 이제 그냥 나오는걸 잘 가져다 쓰면 되서 연구 주제로는 애매하죠.
시계열 분야가 중요성에 비해 딱 이거다 하는게 없긴하네요. 좋은 분야인 것 같습니다. 모든 데이터가 크게보면 다 시계열 데이터라고 봐도 무방하니... RNN 같은 것도 언어 데이터 처리에 잘 맞는거 같은데 시계열에 적합한지는 모르겠더라고요. 성능도 별차이 없고...
저는 연구쪽이긴 보단 조금더 현업에 가까운 사람이라 글쓴분 같이 유능한 분들이 좋은 아웃풋을 내주는 것만 목빠지게 기다리는 느낌입니다. 아무쪼록 좋은 결과 많이 만들어 주시길 바라겠습니다!!
시계열 분야가 중요성에 비해 딱 이거다 하는게 없긴하네요. 좋은 분야인 것 같습니다. 모든 데이터가 크게보면 다 시계열 데이터라고 봐도 무방하니... RNN 같은 것도 언어 데이터 처리에 잘 맞는거 같은데 시계열에 적합한지는 모르겠더라고요. 성능도 별차이 없고...
저는 연구쪽이긴 보단 조금더 현업에 가까운 사람이라 글쓴분 같이 유능한 분들이 좋은 아웃풋을 내주는 것만 목빠지게 기다리는 느낌입니다. 아무쪼록 좋은 결과 많이 만들어 주시길 바라겠습니다!!
제 AMA는 아니지만 대신 답변드리면 데이터의 양과 변수가 적으면 생각하시는게 맞습니다. 실제로 초기의 머신러닝이 그런 형태였기도 하고요.
하지만 보통 머신러닝 딥러닝으로 해결하고자 하는 분야는 변수가 많아 경우의 수가 엄청 많은 경우에 해당합니다.
기상 예보를 예로 들으셨는데 습도 온도 기압을 바탕으로 하는데 그 와 관계된 수치가 수백가지가 있고 또 그 수치가 장소에 따라 수천 지역에 있고 또 그 장소와 수치들이 매시간마다 측정하는 값이 있다면 한시간 마다로 쳐도 하루치는 24배수가 되겠죠. 거기에 내일의 날씨를 예측하기 ... 더 보기
하지만 보통 머신러닝 딥러닝으로 해결하고자 하는 분야는 변수가 많아 경우의 수가 엄청 많은 경우에 해당합니다.
기상 예보를 예로 들으셨는데 습도 온도 기압을 바탕으로 하는데 그 와 관계된 수치가 수백가지가 있고 또 그 수치가 장소에 따라 수천 지역에 있고 또 그 장소와 수치들이 매시간마다 측정하는 값이 있다면 한시간 마다로 쳐도 하루치는 24배수가 되겠죠. 거기에 내일의 날씨를 예측하기 ... 더 보기
제 AMA는 아니지만 대신 답변드리면 데이터의 양과 변수가 적으면 생각하시는게 맞습니다. 실제로 초기의 머신러닝이 그런 형태였기도 하고요.
하지만 보통 머신러닝 딥러닝으로 해결하고자 하는 분야는 변수가 많아 경우의 수가 엄청 많은 경우에 해당합니다.
기상 예보를 예로 들으셨는데 습도 온도 기압을 바탕으로 하는데 그 와 관계된 수치가 수백가지가 있고 또 그 수치가 장소에 따라 수천 지역에 있고 또 그 장소와 수치들이 매시간마다 측정하는 값이 있다면 한시간 마다로 쳐도 하루치는 24배수가 되겠죠. 거기에 내일의 날씨를 예측하기 위해 하루전 이틀전 삼일전 등 얼마나 많은 시계열의 데이터가 필요한지 모릅니다. 즉 이를 다 합하면 변수의 경우의 수는 수조, 수경을 넘어서 컴퓨터로도 모든 경우의 수를 계산하기 어렵습니다. 또한 이 수많은 케이스들 중 오늘 이 시점과 동일한 케이스가 없을 수도 있습니다. 물론 데이터의 변수를 줄여 측정하는 기간과 주기를 줄이고, 장소도 예측하고자 하는 장소 하나만 고려하고, 수치도 습도 온도 기압만 본다면 경우의 수를 크게 줄일 수 있죠. 그런데 그러면 같은 케이스에서 언제는 비가 오고 언제는 비가 오지 않는 케이스가 생깁니다. 고려해야할 변수가 빠지게 되기 때문이죠.
머신러닝, 특히 딥러닝은 이러한 상황에서 예측을 최대한 잘하고자 만든 알고리즘이라고 보시면 됩니다. 엄청난 경우의 수를 여러개의 레이어로 정보를 빼고 모으는 작업을 합니다. 그걸 바탕으로 새로운 정보가 들어왔을때 기존의 데이터들을 통해서 그 결과를 추정합니다. 이것을 데이터 마이닝에서 예측이라고 정의하는 작업이죠. 인문학적, 언어적으로 그 정의가 맞는지는 모르겠지만 적어도 이 분야에서는 그렇게 약속하고 쓰는 표현입니다.
하지만 보통 머신러닝 딥러닝으로 해결하고자 하는 분야는 변수가 많아 경우의 수가 엄청 많은 경우에 해당합니다.
기상 예보를 예로 들으셨는데 습도 온도 기압을 바탕으로 하는데 그 와 관계된 수치가 수백가지가 있고 또 그 수치가 장소에 따라 수천 지역에 있고 또 그 장소와 수치들이 매시간마다 측정하는 값이 있다면 한시간 마다로 쳐도 하루치는 24배수가 되겠죠. 거기에 내일의 날씨를 예측하기 위해 하루전 이틀전 삼일전 등 얼마나 많은 시계열의 데이터가 필요한지 모릅니다. 즉 이를 다 합하면 변수의 경우의 수는 수조, 수경을 넘어서 컴퓨터로도 모든 경우의 수를 계산하기 어렵습니다. 또한 이 수많은 케이스들 중 오늘 이 시점과 동일한 케이스가 없을 수도 있습니다. 물론 데이터의 변수를 줄여 측정하는 기간과 주기를 줄이고, 장소도 예측하고자 하는 장소 하나만 고려하고, 수치도 습도 온도 기압만 본다면 경우의 수를 크게 줄일 수 있죠. 그런데 그러면 같은 케이스에서 언제는 비가 오고 언제는 비가 오지 않는 케이스가 생깁니다. 고려해야할 변수가 빠지게 되기 때문이죠.
머신러닝, 특히 딥러닝은 이러한 상황에서 예측을 최대한 잘하고자 만든 알고리즘이라고 보시면 됩니다. 엄청난 경우의 수를 여러개의 레이어로 정보를 빼고 모으는 작업을 합니다. 그걸 바탕으로 새로운 정보가 들어왔을때 기존의 데이터들을 통해서 그 결과를 추정합니다. 이것을 데이터 마이닝에서 예측이라고 정의하는 작업이죠. 인문학적, 언어적으로 그 정의가 맞는지는 모르겠지만 적어도 이 분야에서는 그렇게 약속하고 쓰는 표현입니다.
고맙습니다. 조언대로 며칠 머리카락 쥐어뜯다보니 조금씩은 익기 시작합니다. 역시 왕도는 시간과 머리카락이란 것을 배웠습니다. 답변에 시간 내 주셔서 감사합니다.
목록 |
|