728x90

  • 개요 : 소셜이커머스 1위인 쿠팡의 과일 이미지를 크롤링하여 이미지 기반 분석 프로그램을 제작함
  • 팀명 : Goofanaka 팀원 : 손기훈 김동건 유주아 김은찬
  • 개발 기간 : 2020년 12월 22일 ~ 2021년 1월 10일
  • 개발언어 : python
  • 크롤링 : Beautifulsoup
  • 데이터베이스 : MongoDB, Mongoengine
  • 분석 및 시각화 : Pandas, jupyter notebook, matplotlib
  • Gui tool : PyQT
  • Git, Github

 


총평

- 처음으로 시도해보는 python 프로젝트였다.

crawling 이라는 단어의 의미를 알고 크롤링 프로그램을 제작하였으며 다시 한번 코딩의 세계에 신기함을 느꼈다.

크롤링 라이브러리를 통해 간편하게 데이터를 가져오고 수집할 수 있었으며

Beautifulsoup 뿐만 아니라 selenium 라이브러리도 써볼 수 있었던 좋은 계기가 되었다.

또한 엔코아 플레이데이터의 교육과정에 배운 mongoDB를 연동하여 이미지 파일도 손쉽게 DB에 저장할 수 있었고

NoSQL에 처음으로 접할 수 있는 좋은 기회였다.

이렇게 모은 데이터들을 Pandas, matplotlib 라이브러리를 활용하여 분석 및 시각화를 구현했다.

확실히 시각화를 통해 데이터를 차트나 그래프로 요약해서 볼 수 있고 가독성이 훨씬 좋았다.

또한 카카오와 구글에서 개발한 vision api를 다루고 비교하면서 이미지 태그 기능을 가까이서 느낄 수 있었다.

제일 좋았던 점은 개인 프로젝트가 아닌 팀 프로젝트였던 부분이다.

팀원들과 git으로 코드를 공유하고 피드백하면서 즐거웠으며 부족한 부분을 서로 채워나가며 프로젝트를 완성하여 더욱 팀워크가 증가했다고 생각한다.

또한 좋은 팀원들을 만나 불화 없이 프로젝트를 완료한 점에서 너무 감사하다.

이러한 Image Tag Analysis Project를 통해서 python을 다뤄본 좋은 경험이 되어 뿌듯하며 앞으로도 다양한 프로젝트를 더 도전해야겠다 결심했다.

 

잘한 점

  • 맡은 기한안에 프로젝트를 마무리한 점
  • 새롭게 배운 python을 사용하여 프로그램을 제작한 점
  • Beautifulsoup, selenium, Pandas 등 다양한 라이브러리를 사용한 점
  • 데이터 수집, 저장, 분석, 시각화를 체험해본 점
  • Kakao, Google vision API를 사용해본 점
  • 팀원들과 Git 활용 및 원활한 의사소통을 통해 프로젝트를 진행하고 마무리한 점

 

아쉬운 점

  • 담당 역할 외 부분에 대해 깊게 공부하지 못한 점
  • 파이썬 활용 프로젝트 경험이 적어 허비한 시간이 많은 점
  • GUI 제작 시 조금 더 효율적으로 클래스화하여 제작하지 못한 점
  • 코드 리팩토링이 덜 이루어진 점

 

개선사항

  • Numpy, Pandas, Matplotlib 라이브러리 공부를 통해 데이터 전처리, 분석, 시각화 능력을 업그레이드하겠다.
  • GUI 레이아웃에 대해 조금 더 이해하여 다음 프로젝트는 클래스화하여 GUI 제작을 도전해볼 것이다.
  • 다양한 python 지식을 습득하여 python code를 더욱 효율적으로 작성하도록 노력하겠다.

 

728x90
댓글
250x250
최근에 올라온 글
«   2024/10   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Total
Today
Yesterday