분류 전체보기 57

BOAZ 제 17회 컨퍼런스

[제17회 BOAZ 빅데이터 컨퍼런스] 안녕하세요. 국내 최초 대학생 빅데이터 연합동아리 BOAZ에서 제17회 빅데이터 컨퍼런스를 개최합니다. 많은 참여와 관심 바랍니다. - 일정: 2023년 1월 28일 (토) 13:00~18:00 - 장소: 서울시청 서소문별관 후생동 4층 강당 - 참가대상: 빅데이터에 관심 있는 누구나 - 참가비: 무료 - 신청링크: https://onoffmix.com/event/269081 자세한 안내 사항은 인스타그램 프로필 링크를 통해 컨퍼런스 신청 링크에 접속 부탁드립니다. * 지금까지 BOAZ에서 진행한 프로젝트는 BOAZ 공식 YouTube채널에서 확인하실 수 있습니다. ☎ 문의 메일: boazbigdata@naver.com 카카오톡 채널: https://pf.kakao..

BOAZ 2023.01.24

Day 06. 덥다 더워

Day 06. (09/30) 일지 몰아 쓰려니 너무 힘들다. 결론적으로 대표님이 주신 논문은 오늘 다 읽었는데 또 일어난 일은 주간완료업무 보고서를 금요일마다 보내는 건데 상식적으로 그러면 그 주간의 업무를 다 하고 보내는건데 나는 이걸 오전에 일일업무일지랑 같이 보내버리고~ 주임님이 오셔서 소유씨 이건 퇴근 전에 보내는 거예요~ 하시고~ 난 또 우리 아빠가 아마 그럴 거라고 얘기해준 걸 왜 등한시하고 일찍 출근해야 한다고 나와서 작성했을까 또 후회하고~ 아무튼 2개 논문 다 읽고 나서야 논문 개요를 검색하고서 그게 abstract라는 걸 알게 되었다 후 ^^^ 왜 introduction까지 꾸역꾸역 읽었던걸까 덕분에 나머지 논문은 일이 줄어 충분히 다 읽을 수 있었던 것이다. 오늘 점심은 정말 오~랜만..

Day 05. 행복은 가까이에

Day 05. (09/29) 전날 돌려놓은 결과 확인! 의외로 파일 크기를 키웠는데 결과가 낮았다. 흠 뭐가 문제였을까... 아마도 트레이닝 과정에서 하이퍼 파라미터를 조절하면 되겠지 근데 난 하기가 너무 싫지 왜냐면 난 똑같은 걸 며칠 째 하 고 있 지 ~ ~ ~ 호옥시라도 업무 사항 받은 거 없냐고 주임님께 여쭤보니 없다 하신다. 그래서 대표님의 구체적인 지시는 없었으나 PointNet 논문으로 다시 돌아와서 논문 읽겠다 그러던 중 반가운 소식!!! 조주임님과 윤연구원님이 오늘 교육해주신다고!!!!! 얏호 그래서 논문 읽다가 10시쯤 외관조사망도랑 회사 프로그램 UI 교육 들었다. 완전하게... 이해는 안 갔지만 확실히 안 듣는 거 보다는 나았다. 듣고 나니 대표님께 와있는 연락! 논문 pdf 파일 ..

Day 04. 끼얏호 성공

Day 04. (09/28) 정확도를 높이기 위해서는 1. 데이터셋 크기를 늘리거나 2. 하이퍼 파라미터를 조절하거나 인데 난 둘 다를 하였다. 우선 데이터셋 크기를 기존 폴더 1개(HDF5 sample 296개)에서 폴더 10개로 늘리고 batch size (아마 32?)랑 epoch은 10번으로 했다. 근데 이날 대표님이 출근하셨었는데 점심시간 전에 갑자기 오후에 면담하자고 하셨어서 결과 내려고 미친 듯이 각성해서 했다 ㅋㅋ (물론 그 전에도 열심히 했다!!!!!) 그 결과 점심시간까지 딱 맞춰서 iou 평가 파일까지 돌려서 overall은 0.9, iou는 그럭저럭 0.8인가 결과를 냈다. 그런데 대표님이 일로 바쁘신지 부르시지 않으셔서 보고서까지 다 써서 메일 제출까지 했는데 딱히 할 업무가 없었..

Day 03. 기술 얘기 줄였어요...

Day 03. (09/27) 우선 결론부터 말하자면 드디어!!! 결과물이 나오기까지 성공한 날이다! 와아~~~ 논문 데이터셋 말고 주임님께서 주신 10분의 1로 줄인 회사 데이터셋을 사용했다는 점에서 의미가 더 있었다. 그런데 ㅋ ㅋㅋ ㅋㅋㅋㅋㅋ iou 평가 지표에 따르면 정확도가 무려 . . . 0.1이다 ^^^^^ 참 앞으로 자세한 기술 이야기는 따로 파서 거기다 작성하려고 한다. 특히 이 PointNet은 논문에 따른 모델이기도 해서... 그게 나을 것 같다~! 호옥시나 관심 가지고 돌릴 사람에겐 한 줄기 빛이 될 수도 있으니... 암튼 근데 ㅋㅋㅋ 주임님과 대화가 웃펐다 ㅋㅋㅋㅋㅋ 나: 주임님 성공했습니다! 그런데... 결과가 0.1..입니다... 주임님: (화면 응시.. 침묵) 나: 보고서에....

Day 02. 우왕좌왕

오늘은 출근하자마자 어제 돌려놓은 거 결과 확인했다. 다행히(?) 에러가 발생했다! 와~~~... 무반응보다는 에러가 훨 나음 😥 그러나 여전히 해결이 잘 안 됐고 ^.ㅠ... 결국 논문 데이터를 쓰기로 한다. 그마저도 잘 안 돼서 어짜고저짜고 엄청 하다가 중간중간 주임님께 무지 여쭤보고..... 반성할 점 중 가장 큰 것은 나름대로 찾아봤는데 모르는 것이라고 생각했는데 깃허브 리드미에 웬만한 절차가 다 적혀있었다는 것이다. . . 그럼에도 알려주신 주임님 감사합니다... 근데 그냥 여쭤본 게 나았을 듯ㅋ 안 그럼 이게 아닌가? 하고 혼자 우왕좌왕~ 사실 이미 혼자 우왕좌왕... 그다음 반성할 점은 내가 너무 느리다는 것 흑흑 나도 회사 업무라고 계속 새기며 빨랑빨랑 해야겠다!!! 그 외에도 계속 오류 ..

Day 01. 첫 출근

자다 깨서 전화를 받고 첫 출근을 했다. 대표님, 이사님, 멘토(사수)님을 뵙고 신입 연구원 직무능력 사전 평가지를 작성하고 법인카드로 밥과 커피를 먹었다. 이후 신입사원다운 지문 등록하기, 돌아다니며 인사드리기 업무를 했다. PointNet 중 Semantic Segmentation 모델을 회사 데이터를 사용하여 돌려보는 과제가 주어졌다. 원격으로 회사 서버 중 하나로 접속했는데 그것조차 사실은 신기했다. 공식 PointNet 깃허브를 클론하여 받았...지만 우분투 환경용이라 주임님이 윈도우용으로 다시 구해주셨다. GPU 메모리 제한으로 batch size를 줄여야 할 수도 있다고 하셨다. 또 회사 데이터 파일 형식을 npy (numpy)로 바꾸고, 그걸 h5로 변환하고, 그걸 train에 돌려야 한다..

배치 정규화(Batch Normalization)

https://github.com/ndb796/Deep-Learning-Paper-Review-and-Practice/blob/master/lecture_notes/Batch_Normalization.pdf GitHub - ndb796/Deep-Learning-Paper-Review-and-Practice: 꼼꼼한 딥러닝 논문 리뷰와 코드 실습 꼼꼼한 딥러닝 논문 리뷰와 코드 실습. Contribute to ndb796/Deep-Learning-Paper-Review-and-Practice development by creating an account on GitHub. github.com https://www.youtube.com/watch?v=58fuWVu5DVU 출처 https://arxiv.org..

Lv4. 교차검증과 모델 앙상블을 활용한 와인 품질 분류하기

# "data"라는 변수에 train의 "fixed acidity"부터 "chlorides"까지의 변수를 저장해주세요 data = train.loc[:, 'fixed acidity' : 'chlorides'] # data의 pairplot을 그려보세요 sns.pairplot(data) # "data"라는 변수에 train의 "fixed acidity"부터 "chlorides"까지의 변수를 저장해주세요 data = train['fixed acidity'] # data의 pairplot을 그려보세요 sns.distplot(data,bins = 100) # 히트맵 그래프를 그릴 변수 지정 (train.corr() ) # corr() 함수는 데이터의 변수간의 상관도를 출력하는 함수 입니다. data = trai..

lec12: NN의 꽃 RNN 이야기

4가지 레이블 중 하나로 나옴. 선행하는 hidden layer가 후행 것에 영향 미침. cost 함수 계산 후 최댓값 선택. error 발생 => softmax 처리 후 학습 시켜야 함. RNN 입력으로 전달받는 데이터: batch size, sequence length, input demension H 하나만 전달 -> sequenc = 1인 데이터. sequence output 변수는 전체 sequence에 대한 hidden state값을 가지고 있고, states 변수는 마지막 hidden state 값과 동일하기 때문에 output 변수의 마지막 hidden state와 동일한 값을 가지고 있다. sequence가 5인 데이터 3개로 구성된 미니 배치를 RNN으로 처리. output 변수는 미니..