null | Eddie’s Blog

Date

Feb 23, 2024 15:00

Type

with Prof.

Contributors

정리 전

논문 리뷰 과정 중 생긴 의문점

(여기에 각자가 생각했던 의문점들 적어주세요)

강민철

생각보다 의류 쪽에서 해볼법한 일들이 꽤나 해결이 되어 있음

Dominant color detection
일반 사진 + 플래시 사용 사진 ⇒ 두 사진을 이용한 원본 색상 추적

But 좀 불완전해보임

의외로 리뷰 텍스트가 큰 도움이 되지 않을 듯함

도전은 해볼 수 있겠지만 과연 멀티모달에 집착하며 이걸 계속 고수할 필요가 있을지?
산업 확장성 면에서도 다른 방식의 true color detection을 생각해보는 게 낫지 않을까?

다만 ‘러플 대표’ 개인의 한 의견에 너무 크게 휘둘려 좁게 생각하지는 않았으면

어쨌거나 필요한 사람도 분명 있음
또한 다른 방면에서 쓰일 가능성을 생각해볼 수 있지 않을까?

전상우

dataset

quality vs quantity

clothes only vs all the other

논문 게재

학술지에 따라 논문 게재료의 차이가 큰데 ugrp 수준의 논문은 어떤 학술지에 게재해야 할까? 아니면 목표로 삼을만한 학술지가 있을까?

김지현

text review의 주관성 때문에 text review 그 자체 보다는 image 처리에 더 집중하는게 낫지 않을지?

이런식으로 data labeling 페이지를 만들어 직접 labeling을 진행한다면 비교적 빠르게 많은 data를 얻을 수 있을 거 같음

김상우

옷의 질감에서 오는 차이를 어떻게 처리할지도 중요.

이미 true color detection이 잘 된다면 이를 이용해 소비자에게 경험을 제공하는 모델은 어떨지. 무신사 같은 브랜드와 소비자를 이어주는 플랫폼 입장에서 본다면 소비자가 다른 곳에서 경험할 수 없는 서비스를 제공하는 것이 중요하지 않을까 생각됨.

상품 페이지에서의 의류 사진은 보통 인위적인 조명에서 찍은 사진 → true color detection 결과를 바탕으로 자연광 등 일상에서의 조명 또는 소비자가 직접 텍스트를 입력해 상황 별 옷의 색감이 어떻게 보일지 생성(예상)하는 모델 등등.

색상 간의 상대적인 차이도 표현하는 것은 어떨지

정확한 색만을 제공하는 것보다는 이미 소비자가 갖고 있는 비슷한 색상의 의류를 입력하면 이를 기준으로 더 밝은지 어두운지 설명하는 것이 소비자에게는 더 와닿지 않을까 생각됨.

의류 브랜드에서 갖고 있는 몇천장의 의류 사진 중 무신사에 업로드하는 사진은 어떻게 정하는지 의문이 생김. 만약 사람이 직접 정한다면 이를 AI로 대체할 수 있지 않을까 생각됨.

박영진

데이터셋 구축할 때 고려해야할 것들… ( 텍스트 모호성 (누리끼리, 시퍼런,,,) , 언어 문제 (도메스틱 플랫폼 application이 목적이라면, 한국어 text data가 충분할까? 한 제품에 대해 색깔 언급한 review가 학습에 이용될 정도로 충분할까? 등등,,,)

output type → 자연어? RGB?

강지헌

700만원 예산으로 제한이 되어있어 AI 구동에 필요한 장비(그래픽카드, 고성능 컴퓨터 등)를 제한적으로 구매할 수 있을 것 같은데, DIAG Lab에서 기존에 AI를 어떤 장비를 가지고 테스트를 하는지 궁금하고, 혹시 장비적으로 도움을 받을 수 있는 부분이 있는지?

큰 데이터를 담을만한 용량 높은 외장하드나 다른 장비들을 보통 어떻게 사용하는지?

주제 자체가 의류 산업, 특히 경제활동이 활발한 분야 안에서의 연구라 연구가 어디에 쓰이고 어떤 목적으로 쓰이는가, 이게 실용적으로 쓰일만한가에 대한 고민이 계속해서 들게 된다. 보통 연구를 수행할 때 ‘연구자’의 입장에서는 어느 범위까지, 어떤 방향으로 연구의 목적성을 고려하는 것이 적절한가?

논문 게재를 할 때 드는 비용은 일반적으로 후순위로 둔 다음에, 게재를 하면서 남는 금액을 활용

논문 게재료를 지불할 때, 2학기가 지나고 겨울 방학이나, 그 이후로도 결제가 가능한 지 문의 필요

목표할 만한 학술지/저널 추천이 필요

AI용 컴퓨터를 사용할 때, 서버를 구축하기 위해 필요한 장비가 그래픽 카드만으로 커버가 가능한지?

워크스테이션에 우리가 산 그래픽 카드만 추가로 꽂아서 활용할 수 있도록 해주실 수 있는 건지? 아니면 전부 구축해야하는 건지?

Text Review의 활용이 꼭 필요한가?

유의미한 Text Review가 있으면 Multi Modal이 필요할 것 같다.

human annotation 방식으로 dataset을 제작하는 방법도 있지 않을까?
multimodal model 학습을 위한 유의미한 데이터에 대한 기준을 설정하는 것 / 필터링하는 방법도 하나의 연구주제가 될듯

Text는 오로지 CV쪽에서 나오는 결괏값을 보정해주는 수준의 용도도 괜찮을 듯

실제로 Text Review가 참고할만한 가치가 되는가에 대한 판단은 먼저 필요할 것 같다.

빡빡하게 생각할 필요가 없음. 프로덕트를 개발하는 것이 아니기 때문에

텍스트랑 이미지만 있어서 그런 것 같은데, (오디오 시그널의 형태도 있고) 다른 것을 다 포기하더라도 멀티모달을 가져가고 싶다고 생각한다면, 데이터 종류의 방향성은 넓혀서 생각해보자.

논문을 보면, 본인들이 직접 라벨링을 어느 정도 해서, Text Dataset을 구성하는 경우도 있었으니까, 이런 방식으로 접근해도 나쁘지 않다.

해보고 성공하면 best이지만, 안 되더라도 여러 approach 중에 안 되는 거 한 두 개를 지워줄 수 있다는 점에서도 연구의 의의를 찾을 수 있을까?

우리와 방향성이 맞는 연구 과제 사업이 있으면, 교수님이랑 같이 시도해보는 것도 좋을 듯.

준비 현황

논문 리뷰 3회차 종료

1차: 교수님 추천 refs로 진행

2차: 관련 논문 search해서 진행 (적용 가능할 만한 metric 탐색 중)

⇒ Multimodal 관련 내용이 주를 이루긴 했지만, dataset, CV, NLP 단독 주제의 논문도 review

논문 리뷰 요약

True Color Detection에서 base model이 되어줄 만한 논문 확보

링크

But 방향성에 대한 걱정거리가 생김

연구 방향성

해보고 성공하면 best이지만, 안 되더라도 여러 approach 중에 안 되는 거 한 두 개를 지워줄 수 있다는 점에서도 연구의 의의를 찾을 수 있을까?
⇒ 현재의 고민은 연구보다는 product를 상정한 고민이 되어가는 것이 아닌가

Multimodal의 효용성에 대해 아직은 의문을 가지고 있음

Text review의 가치가 충분히 높은지 의문

온라인 쇼핑에서 제대로 된 리뷰가 충분할 것인가

제대로 된 리뷰를 찾아내는 방법을 고안하는 것도 하나의 연구가 되지 않을까
“리뷰가 유의미하다”는 것의 수치적 기준을 제안하는 것도 좋지 않을까
학습에 필요한 데이터셋을 직접 구축해보는 것도 하나의 돌파구가 되지 않을까

확장 측면에서 타 산업(제조업, 농업 등)에서 text signal이 사용될지 의문

외부 협업 지원 현황

Naver AI LAB

제휴제안 등록 페이지 - https://www.naverlabs.com/proposal

(2020년 네이버 AI 랩이 네이버랩스와 분리되어서, 네이버랩스는 로보틱스,모빌리티 담당이 됨.)

Naver AI LAB에 필요한 것

Naver 혹은 Naver 쇼핑에서 가지고 있는 의류 사진 데이터에 대해 필요할 가능성 有

Naver가 가지고 있는 AI 장비

네이버의 AI 분석 전문가(특히 쇼핑Live나 의류쪽 데이터를 이용한)의 조언

제휴구분

파트너 유형에 대한 설명: https://www.ncloud.com/partner/program

우리 UGRP 팀은 컴피턴시 파트너 혹은, General 파트너에 적합 예정

컴피턴시 파트너

네이버에서 제공가능한 서비스 (추가 가능)

ㆍ AI Services: CLOVA AiCall / CLOVA OCR / CLOVA Chatbot

ㆍ Big Data & Analytics : Cloud Data Box

ㆍ Business Applications : SMARTWORK / LIVE COMMERCE POT

ㆍ Application Services : Maps / Clara Parabricks

자격 요건

부문별 수행프로젝트 제출 및 프로젝트 수행결과 리뷰 진행

사업 첫 해 일정 매출 목표 달성 (부문별 상이)

결론: 네이버와 제휴를 맺는 것도 함께 사업을 하는 의미여서 매출을 내고자 하는 프로그램이 전반적인 것 같으나, 서울대학교나 카이스트와 같은 대학교와의 제휴이력도 있어 파트너구분을 면밀히 하여 AI 장비나 Data Analytics쪽으로 도움을 받으면 좋을 것 같음.

꼭 장비적인 지원이 아니더라도, 파트너를 함으로써 받을 수 있는 교육이 많아 그러한 목적도 좋을 것 같음.

기타 사항

장비

워크 스테이션 사용 방식이 궁금함

연구비로 워크 스테이션 전체를 구축하는 것은 불가능할듯
그래픽카드만 구매해서 추가해도 되는지

논문 게재

게재 가능 여부는 알 수 없지만 목표로 할만한 저널이 있을지

게재를 한다면 일반적으로 언제까지 결과를 도출해야하는지

미팅 내용

방향성

원래 하려던 트루컬러디텍션이라는 주제가 적당한가? (방향성, 꼭 멀티모델이 필요한가?) 상업적인 부분을 생각했기 때문에 고민이 생김. 학업적인 목적이라면 한 번 해보는 것이 어떤가? 핵심을 무엇으로 갖고 갈 것인가. 트루컬러디텍션에 집중할 것인지 멀티모델에 집중할 것인지

트루컬러디텍션과 멀티모델이 큰 연관성이 없다는 것을 발견한 것도 의미가 있다.

트루컬러디텍션을 위한 멀티모델을 연구했을 때 효과가 없다면 위험이 크다. 미련이 없다면 멀티모델을 버리는 것도 좋을 것 같다.

효과가 없음을 밝히는 것도 중요하지만, 요즘은 이런 논문이 별로 나오지 않는다. 설득력이 위해서는 모든 경우의 수를 다루어도 어렵다.

제한된 상황에서 성능이 좋았다 같은 것을 무신사 등에 제안하는 것도 좋다.

의미있는 리뷰를 선정하는 것에 도전해볼 가치가 있다. 의미있는 리뷰를 찾는다면 이를 통해 소비자들이 유의미한 리뷰를 작성할 수 있는 가이드라인 등을 제공할 수 있어 업체의 흥미를 끌 수 있다. -> 가치있는 리뷰를 찾는 것만으로도 상업적인 의미가 있다.

결국에는 멀티모델을 갖고 갈 것인지를 먼저 결정해야 한다.

멀티모델을 언급한 이유는 학부 수준에서 이미 고도화된 트루컬러디텍션을 쉬운 접근법으로 다가갈 수 있기 때문이다. 일단 해보는 것도 좋을 것 같다. 실패를 한다 생각하고 해보는 것은 어떤가

협업 관련

Q 무신사는 아직 방향성이 정해지지 않아 컨택하지 못함. 네이버 랩스는 기업이다 보니 이윤 창출을 중요하게 생각하는 경향이 있었음.

파트너(MOU)는 규모가 너무 크다. 협력의향서 작성해서 네이버 랩스 관련자에게 개인적으로 접근하는 것이 가능하다. 설득력이 있다면 데이터를 받는 것도 가능하다.

예산 Q

워크스테이션을 어떻게 돌리는 것이 가능한가? 데스크탑 전체를 구축해야하는지 그래픽카드만 구입하면 되는지 궁금하다.

연구실에 남는 컴퓨터가 있다면 제공 가능하다. 하지만 그래픽카드만도 비싸다. 연구실에 워크스테이션을 배치하는 것은 공간이 없어 어려울 것 같다. 학습에만 사용할 거라면 굳이 워크스테이션을 구성할 필요는 없다. 학습할 때만 대여(AWS, 컴퓨팅센터, colab)해서 돈을 아껴 학회 예산을 늘리는 것이 좋을 것 같다.

논문 게재

CS 쪽은 논문게재료가 없다. 있더라도 연구실에서 제공해줄 수 있다. 학회도 참가비만 받고 게재료는 받지 않는다.

논문 목표는 높은 곳을 겨냥하고 안 되면 낮추자. 깊이보다는 분석을 잘하는 것이 중요할 수 있다.

대조군으로 사용할 모델을 잘 선택해야 한다.

CS 데이터에서 옷만 detection하는 데이터 수집