기계지능은 머신러닝, 인공지능, 빅데이터 등의 연관 분야가 포함된 고급 주제다. 오늘날 두 가지 경향으로 인해 머신러닝이 널리 성공하고 있다.
- 기술적 발전으로 인해 저장장치의 크기는 늘고 가격은 저렴해졌다. 그리고 기술 발전으로 인해 프로세서와 네트워크도 더 빨라졌다.
- 인터넷으로 인해 엄청난 양의 데이터를 쉽게 수집할 수 있게 됐다.
개요
머신러닝
어떤 수준의 머신러닝을 사용하든 통계학을 만나게될 확률이 아주 높다.
1) 베이즈
영국 목사인 토머스 베이즈가 자기 이름과 똑같은 베이스 정리를 증명했다.
540p~541p
2) 가우스
독일 수학자인 가우스는 종모양 곡선, 정규 분포나 가우시안 분포라고 불리는 확률 분포에 대해 만들었다.
예를 들어 농구선수의 키를 측정할때 선수 중 68%는 평균에서 표준 편차안에 들어가고 키의 분포도 모양은 종모양 곡선에 더 가까워진다.
542p~544p
3) 소벨
545p~550p
4) 캐니
소벨의 결과에 몇 가지 단계를 추가해서 테두리 감지를 개선했다.
- 비최댓값 억제 -> 이미지의 테두리 중 일부가 두껍고 모호하다. 테두리가 가늘면 나중에 이미지의 특성을 더 쉽게 알아낼 수 있다. 즉 비최대값 억제는 테두리를 가늘게 하는 기법이다.
- 이력을 활용한 테두리 추적 -> 약한 테두리를 없애고 강한 테두리를 남긴다.
5) 특성 추출
특성 추출 알고리즘은 아주 많다. 그중 ‘휴 변환’ 같은 것은 선이나 원 같은 기하학적인 모양을 추출하기에 좋다.
특성을 찾았으면 이 특성들을 분류기에 넣어서 분류기 입력에서 +는 특성이 있는 이미지가 결과에 부합하는 특성이란 뜻이고, -는 이런 특성이 있는 이미지는 결과에 반하는 특성이라는 뜻이며, 0은 아무 도움도 되지 않는 특성이라는 뜻이다.
6) 인공 신경망
인공지능에서 사용해온 접근 방법 중에는 인간의 행동을 흉내 내려는 노력이 있었다. 인간의 경우 뉴런이 큰 역할을 한다는 사실을 잘 알고 있다. 인간에게는 860억 개나 되는 뉴런이 있다.
뉴런은 간단하다는 점에서 게이트와 비슷하고, 더 복잡한 회로, 즉 신경망을 이룰 수 있다는 점에서도 비슷하다. 뉴런의 핵심은 입력의 가중치를 더한 값에 따라 활성화된다는 점이다. 따라서 여러가지 입력 조합이 뉴런을 활성화할 수 있다.
최초로 인공 뉴런을 만들려는 시도로 퍼셉트론 이었다. 퍼셉트론은 입력과 줄력이 2진수이다. 그래서 입력과 출력은 0 아니면 1 밖에 올 수 없다. 퍼셉트론은 AI 분야에서 활용됐다. 특히 다중 계층 신경망이 생기고 여러가지 문제를 해결할 수 있게 되었다. 퍼셉트론의 2진법적인 특성으로 인해 가중치 결정이 어려웠다. 퍼셉트론의 비교기를 시그모이드 함수로 바꿔서 이런 문제를 해결한 시그모이드 뉴런이 탄생한다. 시그모이드 뉴런에서는 역전파 기법을 사용해 신경망의 가중치를 결정할 수 있다.
인공 신경망의 큰 문제는 나쁜 훈련 데이터에 의해 신경망이 중독될 수 있다는 점이다. 아이일때 TV를 너무 많이 본 어른이 나중에 어떤 이상 행동을 할지 모르는것처럼 머신러닝 시스템도 마찬가지다.
7) 머신러닝 데이터의 활용
인공지능
561p~564p
빅데이터
빅데이터는 움직이는 표적이다. 빅데이터라는 말은 너무 크고 복잡해서 오늘날의 기술로 마구잡이식으로 처리하면 처리가 불가능한 데이터를 뜻한다. 빅데이터라는 용어는 분석뿐만 아니라 데이터 수집, 저장, 관리에도 적용된다.
565p~568p