Book Report

[독서후기] 이미지 처리 바이블 (파이썬,OpenCV,텐서플로로 배우는 이미지 처리와 컴퓨터 비전의 모든 것)

변화의 물결1 2024. 5. 14. 00:03

 

 

 

안녕하세요.

 

 이번에 처음으로 레뷰(REVU) 캠페인에 선정되어서 독서후기를 올리게 되었습니다. 캠페인이다 보니 책에 대한 장점을 조금 더 설명할 수도 있습니다. ^^;

 그러나 책을 구매해서 보려는 다른 구매자에게 참고가 될 수 작성하자라는 생각으로 후기를 작성하였습니다.

 


 

1. 책 표지

 

 예제들이 파이썬 언어로 되어있다 보니, 파이썬 아이콘도 그렇고 비단뱀 표지를 사용하고 있습니다. 개인적으로는 뱀보다는 다른 그림이면 좋지 않았을까 생각이 들기도 했습니다.

 

 

 

2. 출판 정보

 

 4월 30일에 초판 발행된 따끈따끈한 책이라 설레는 마음이 들었습니다. 그리고 현재 시점에서 최신 영상처리 기술과 논문 등을 확인할 수 있고, 라이브러리 버전 문제없이 바로 실습해 볼 수 있는 장점이 있었습니다.

  

 

 

3. 목 차

 

크게 7가지 장으로 아래와 같이 나눠져 있습니다.

 

 1장 기본 개념과 도구

 2장 이미지 처리 기초

 3장 인공지능과 이미지 처리

 4장 이미지 분류

 5장 객체 탐지

 6장 이미지 생성

 7장 실제 사례 및 프로젝트

 부록 A 코랩 사용하기"로 되어 있습니다.

 

 

 

 

 

4. 내용 확인

 

(1) 1장 기본 개념과 도구

 

 이미지 처리와 컴퓨터 비전의 내용으로 이미지 분석이란 개념에 대해서 설명해주고 있으며, 컴퓨터 비전이란 정의와 활용에 대해서 설명해 줍니다. 즉, 왜 이미지 처리가 필요한지 설명을 해줍니다.

 

  

 

  추가로 책 내용을 실습해보려면 파이썬과 OpenCV에 대해서 이해하고 있어야 하기 때문에  필요한 문법과 간단한 예제를 보여주며 설명하고 있습니다.

 

 

 

(2) 2장 이미지 처리 기초

 

 이미지 처리를 위한 수학적 이론과 실습하며 OpenCV 라이브러리를 이용해서 결과를 확인할 수 있습니다.

 

 

 

(3) 3장 인공지능과 이미지 처리

 

 인공지능 관련 수업을 들었다면 한 번쯤 들어 보았을 인공 신경망 기초인 퍼셉트론, 활성화 함수,  손실함수, 합성곱 신경망(CNN) 등 설명해 주며 팁러닝을 활용한 이미지 처리하는 실습을 합니다.

 이어서 모델에 구현과 학습을 진행하며, MNIST 데이터 셋으로 실습하여 이 장을 마무리합니다.

 

 

 

(4) 4장 이미지 분류

 

 VGG, 구글넷, 레즈넷 등 이미지 분류 모델들의 발전 과정과 큰 변화과정에 대해서 설명해 줍니다. 테스트 가능한 모델들은 직접 실습을 통해 확인해 볼 수 있게 했으며, 모델에 대한 성능과 비교가 필요한 것들은 이론을 설명하면서 비교하며 이미지 분류 모델의 설명을 마무리합니다.

 

 

 

(5) 5장 객체 탐지

 

 4장에 이어서 객체 탐지는 이미지 내의 여러 객체를 식별하고 위치를 찾는 작업이 포함하는 기술로 머신 러닝과 딥러닝을 기반으로 한 최신 객체 탐지 알고리즘과 기법에 대해 설명해 줍니다.

 

 여기서부터 우리가 AI하면 조금씩 봐온 객체가 인식되면서 사각박스가 표시되는 내용들이 나오게 됩니다. 그리고 그중에 객체 탐지 효율성과 속도를 높이기 위해 설계된 YOLO에 대해서도 설명해주고 있으며, 추가로 SAM 모델에 대해서도 실습해 볼 수도 있습니다.

 

 

 

(6) 6장 이미지 생성

 

 GAN(Generative Adversarial Networks)이라고 해서 현재 많이 이슈가 되고 있는 이미지 생성 모델들이 어떠한 흐름으로 발전되었는지 설명해 줍니다.

 

 그중에 StarGAN과 StyleGAN 모델에 대해서 이론 설명과 실습을 진행하며, 추가로 최근 유행하는 Stable Diffusion 다양한 모델의 이론과 실습 모델에 대한 내용도 설명해 줍니다.

 

 이론 설명들을 보면 최신 논문 리뷰 내용도 곳곳에 있다는 것을 있고, 그중에 최근에 현업에서 사용하고 있는 CLIP(Contrastive Language-Image Pre-training) 멀티모달 기법까지 설명에 포함되어 유용하다고 생각했습니다.

 

 

 

(7) 7장 실제 사례 및 프로젝트

 

 저자가 위의 이론과 실습을 해봤다면 실제적인 적용 사례가 궁금할 것이라고 해서인지 건설, 의료 실제사례를 이야기해 주고 있습니다. 그러나 현장 AI 모니터링 개발한다고 하면, 단독으로 AI 모델만 돌려 검출하는 것으로 끝나지는 않고 도커(Docker) 기반의 여러 영상채널을 동시에 처리하는 로직과 상위 프로그램과 데이터를 주고받는 부분까지 고려해서 개발해야 합니다.

 이런 내용까지 포함하기에는 책 내용과 맞지 않기 때문에 모델 설계와 인식과 분류 내용으로 마무리했다고 생각됩니다.

 

 

 

(8) 부록 A 코랩 사용하기

 

 일반 독자라면 윈도우에서 테스트할 것입니다. 그래서 이 부분이 앞쪽에 배치하여 실습 환경내용으로 나와야 하지 않을까 생각되는 부분이었습니다. 입문자라면 부록의 코랩 사용하기를 먼저 보시고, 구글에서 제공해 주는 프레임워크를 이용해서 예제를 실습하면 도움이 되지 않을까 합니다.

 

 

 

5. 예제파일 확인

 

(1) 출판사 깃허브

https://github.com/gilbutITbook/080398

 

(2) 저자 깃 허브

https://github.com/Lilcob/imageprocessingbible

 

 깃 허브에 소스코드가 있고 하단에 설명에 보면 각 장마다 예제 소스를 바로 실행해 볼 수 있도록 "구글 코랩 실행하기" 링크가 걸려 있습니다. 이것을 눌러 Colab에서 바로 실행해 볼 수 있습니다. (구글 로그인 필요)

 

 

 

 책에도 적혀 있지만, 바로 실행해도 되지만, 오류가 발생할 수가 있으므로 Colab 메뉴에 File(파일) -> Save a copy in Drive(드라이브에 사본 저장) 한 후 실행하는 것을 추천하고 있습니다.

 

 

 

순차적으로 실행시켜 책에서 설명하는 결과와 비교하며 확인할 수 있습니다.

 

 

 

6. 전반적인 후기

 

 인공지능이라고 해서 그냥 되는 것이라고 생각할 수도 있지만, 내부적으로는 많은 수학과 이론의 결과물로 볼 수 생각되었습니다. 그중에서도 이미지 부분에 대한 많은 논문 내용과 선행지식이 필요한데, 저자는 '딥러닝논문읽기모임' 유튜브 운영자로 논문에 수록된 머신러닝/딥러닝 모델을 설명하고 있어 최소한의 선행 지식을 가지고도 이해할 수 있게 설명하고 있다고 생각이 되었습니다.

 

 이미지 처리 바이블이라는 이름답게 이미지 처리가 입문부터 활용까지 한 권으로 볼 있게 구성되어 있고 실습을 위한 파이썬, OpenCV, 텐서플로로 배우는 이미지 처리와 컴퓨터 비전 모든 부분에 대한 설명을 포함하고 있습니다.

 

 신간이다 보니, OpenCV, 파이썬, 텐서플로를 기준으로 모든 라이브러리는 최신 버전으로 실습을 진행하고 있어 현시점에서 라이브러리 버전 문제없이 실습을 가능했습니다.

 

 추가로 코랩을 통해서 직접 실습까지 해주는 장면 한 두 파트가 있었으면 좋지 않았을까 생각이 되었습니다.

 

 AI 이미지 처리가 처음인 입문자가 바로 책을 보고 이해하기는 어려울 수 있지만, 이미지 처리와 컴퓨터 비전 분야의 기초에서 최신 기술 폭넓게 지식을 습득할 기회가 되고, 누군가가 잘 정리해 놓은 논문 이론과 그것을 실습을 해볼 수 있게 만들어 놓았다고 생각하면 시간 단축효과도 있다고 생각이 되었습니다.

 

 이미지 처리 바이블이라는 이름답게 이미지 처리 입문부터 활용까지 한권으로 있게 구성된 입문자가 보기 좋은 책이라고 생각됩니다.

 

 

7. 구매 가능한 링크

http://gilbut.co/c/24049397RD

 

 

 

감사합니다.

 

 

 

반응형