# 목차
서문 KAIST 캠퍼스에서 전하는 빛나는 ‘인생 수업’
정재승 KAIST 바이오및뇌공학과 교수
1부 구글 신은 뭐든지 알고 있다 복잡계 네트워크와 데이터 과학
정하웅 KAIST 물리학과 교수
1강 세상을 묶는 끈들의 갈래 따기
2강 복잡계 네트워크의 응용
3강 데이터 과학과 복잡계
2부 생명의 본질, 나는 정보다 생물 정보학의 최전선
김동섭 KAIST 바이오및뇌공학과 교수
1강 정보 처리 기관으로서의 생명
2강 어떻게 유전 정보를 해석할까?
3강 나의 유전체, 나의 삶
3부 퀀텀 시티 속에 정보를 감춰라 양자 암호와 양자 정보학
이해웅 KAIST 물리학과 교수
1강 암호의 세계
2강 양자 암호의 세계
3강 양자 정보의 세계
# 구글 신은 뭐든지 알고 있다 복잡계 네트워크와 데이터 과학
이름만 복잡한 복잡계 네트워크
과연 복잡계 네트워크란 무엇인가?
우리가 살고 있는, 우리가 경험하는 자연은 현재 일어나고 있는 사회 이슈 및 현상들 질서와 무질서등 이 모두 네트워크로 이루어져 있다. 당신의 가족도 당신이 아는 연관 없는 사람들도 모두 서로 복잡계 네트워크라는 이름의 점과 선으로 연결되어 있다. 복잡계 네트워크 이름만 들었을 때 는 참 어렵고 복잡해 보인다. 하지만 간단한 이론만 알면 그다지 어렵지 않다.
복잡계! 복잡계! 복잡계 네트워크가 무엇이길래!
위에 서문에서 복잡계 네트워크라는 낮선 단어가 나온다. 복잡계 네트워크는 헝가리 국적의 northwestern university 앨버트 라슬로 바라바시 교수가 처음 제시 했으며 “척도 없는 (Scale-Free) 네트워크”라는 개념으로 처음 소개를 했다. 이후 복잡계 네트워크란 이름으로 자리를 잡아가며 현재 까지도 계속 연구되고 있다. 그럼 대체 복잡계 네트워크가 무엇 이길래 이리 자주 나올까? 복잡계 말만 놓고 보면 뭔가 복잡하고 어려울 것 같다. 하지만 정작 알아보면 그렇게 어렵지 않다. 복잡계 네트워크란 “복잡계란 많은 구성요소들이 그들 사이에 연관관계를 가져서, 각 구성요소의 행동이 다른 요소들의 행동에 좌우되는 네트워크 이다.” 라고 "H. A. Simon" 이라는 학자가 정의 했다. 간단하게 말하면 “불확실성을 지닌 복잡해 보이는 것들이 서로 연결되어 있다는 것을 의미한다.” 실제 복잡계 네트워크를 보면 여러 개의 점과 선들이 복잡하계 연결되어 있는데 이걸 복잡계 네트워크라고 보면 된다.
그럼 이제 복잡계 네트워크가 뭔지를 알겠는데 이걸 어디다 사용해야 할지 모르겠다. 실제로 현재 우리가 사는 세상에서 활용되고 있는 용도로는 인터넷 연결망 네트워크, 월드 와이드 웹 네트워크, 신약 개발을 위한 단백질 네트워크 등 여러 분야에서 활발히 이용 되고 있다. 위 네트워크들의 공통점은 점과 선으로 이루어져 있으면서 서로 연결이 불확실적으로 복잡하게 연결이 되어 있다는 것이다. 그럼 점과 선으로 불확실적으로 복잡하게 연결되어 있다면 복잡하게 연결이 되어 있다면 복잡계 네트워크 인가? 대답은 “맞다!” 이다. 우리는 이제 복잡계 네트워크에 대해서 다 알고 있으며 이걸 활용하면 우리도 복잡게 네트워크를 만들 수 있을 것이다.
복잡계 네트워크의 특징을 알아보자!
자! 그럼 이제 복잡계 네트워크에 대한 이론은 알았으니 복잡계 네트워크의 특징들을 알아보자 복잡계 네트워크는 총 5가지의 특징이 있는데 “1. 많은 구성요소를 가지고 있다.” 복잡계 네트워크는 여러 개의 점과 선으로 구성되어 있다고 이론에서 설명 하였다. 점은 해당 네트워크를 구성하는 특정 요소들이고 선은 그 요소들간의 연관 관계를 뜻한다. 예를 들어 독감 보균자라는 특정 요소의 점이 있다. 이 특정요소가 한사람 또는 여러 사람을 감염 시키면 독감 보균자와 독감 감염자는 서로 점과 점 사이의 선으로 이어지는 것이다 이렇게 특정 구성 요소들 끼리 서로 영향을 주고받는다. “2. 서로 비선형적인 상호작용을 한다.” 복잡계 네트워크는 여러 가지의 요소들로부터 영향을 받아 쉽게 예측하기가 어렵다. 그리고 때때로 작은 요소가 큰 역할을 하는 경우가 있는데 이를 매개자라고 한다. 예를 들어 청팀과 백팀이 있다. 이 청팀과 백팀은 서로 단절되어 있는데 청팀과 백팀을 연결해주는 한 사람이 있으면 그 사람이 매개자 가 된다. 그 사람이 있음으로써 청팀과 백팀이 그 사람을 통해서 연결이 되는 것이다.이 연결자를 메개자 라고 한다. “3. Feedback loop를 형성한다.” 2번 특징에서 말했듯이 복잡계 네트워크는 여러 가지의 요소로부터 영향을 받는다. 이 여러 요소들로부터 다양한 경로를 통해 연결 되다보면 다시 자기 자신에게 연결되는 경우가 있다. 쉽게 예를 들면 1, 2, 3, 4이라는 구성요소가 있는데 1은 2를 알고 2는 3을 알고 3은 4를 알고 다시 4는 1을 아는 경우를 말한다. “4. 열린 시스템이며 경계가 불분명하다.” 이것도 위에도 말했듯이 외부환경과 차단되어있지 않고 여러 특정요소 들이 다른 요소들과 끊임없이 영향을 주고 받는 걸 말한다. 그 경계는 불분명하며 자연적으로 정해지는 것이 아니라 관찰자의 의도에 따라 달라진다. “5. 복잡계의 구성요소는 또 다른 복잡계이며 끊임없이 적응해 나간다.” 위 5가지의 특징들이 있다.
고속도로 연결망, 비행기 항공망
언제나 네트워크는 점과 선으로 연결되어 있다. 그럼 그 점과 선을 어떻게 연결하여야 하는가? 일단 복잡계 네트워크를 두 가지로 나뉘어 보자. 첫 번째로 고속도로 연결망인데 고속도로를 선으로 생각하고 도시를 점으로 생각하자. 고속도로를 보면 인천에서 부산을 가려고 하면 수원, 충남 등을 지나야 부산을 갈수가 있다. 이 렇듯 주위의 점을 선을 타고 가야만 또 다른 점에서 또 선을 타고 가야만 특정 점으로 갈수가 있다. 하지만 항공망은 다르다.비행기를 타고 다른 나라로 가려면 경유를 해가는 경우도 있는데 곧바로 다른 나라로 갈수가 있다. 이것이 고속도로 연결망과 비행기 항공망의 차이인데 이걸 분포 함수로 그려보면 고속도로 연결망(좌)은 대부분의 점이 같은 횟수로 연결되어 있다. 고로 많이 연결되어 있는 또 적게 연결된 점이 없다. 하지만 비행기 항공망(우)은 몇 번 연결되어 있지 않은 점들이 고속도로 연결망 보다 많고 연결횟수가 많은 점들도 보인다. 그럼 어떤 것이 더 좋아 보이는가. 어떤 것이 더 활용도가 높을까? 연결선이 균등하게 연결된 고속도로 연결망? 연결이 균등하지 않은 비행기 항공망? 활용에 따라 다르겠지만 실제 네트워크를 보면 비행기 항공망이 더 자주 사용되고 실제 세상에서 일어나는 일들을 보면 거의 고속도로 연결망 보단 비행기 항공망으로 해결을 한다. 예를 들어 페이스북 이용자들 중 친구 관계도 또는 국가 간의 협력 관계 등을 보면 거의 항공망을 이용해야만 네트워크가 그려진다.
구글은 실제 복잡계 네트워크를 활용하고 있다?
미국에는 CDC(Centers For Disease Control)이라는 기관이 있다. 질병 통제 예방 센터 인데 이 CDC에 2008년에 구들이 도전장을 던졌다. CDC보다 먼저 세계 독감 환자가 몇 명인지 예측하겠다는 건데 CDC는 독감 환자가 병원에 오면 상부 기관에 보고한다. 그래서 병원은 동사무소에 보고하고 동사무소는 그 데이터를 모아서 구청에 보고하고 구청은 시청에, 시청은 주 정부에, 최종적으로 주 정부가 CDC로 넘긴다. 그러면 CDC가 통계를 내서 지역마다 독감환자가 몇 명인지 통계를 낸다. 그런데 보통 이런 식으로 하면 누락이 되거나 오래 걸리기 십상이다. 정리하는데 걸리는 시간은 2주가 걸리는데 독감이 퍼지는데 2주면 금방 퍼진다. 대책을 세워봐야 이미 독감이 퍼진 이후라 필요가 없다.
하지만 구글은 복잡계 네트워크를 이용하여 세계 독감 환자를 파악했다. 사람들이 열이 나거나 몸에 이상이 나타나면 내가 무슨 병에 걸린 건 아닌지 검색을 한다. 독감에 걸렸을 겨우 “기침”,“고열”,“해열제” 등 독감과 관련된 단어들을 검색하는데 구글 서버는 각 검색어가 어느 IP 주소에서 왔는지 알기 때문에 그 단어가 많이 나온 도시를 찾아서 발표를 하면 된다. 그런데 이게 왜 복잡계 네트워크냐 라는 질문을 필시 할 것이다. 이것은 복잡계 네트워크가 아니기 때문이다. 구글이 가지고 있는 복잡계 네트워크는 독감에 관련된 단어들의 복잡계 네트워크이다. 독감이라는 키워드를 갖고 단어들끼리 연결을 하여 그걸 분석해서 네트워크를 만든 것이다. 물론 이것은 구글에서 공개를 하지 않고(공개를 하면 사람들이 장난삼아 쳐보기 때문에 자료의 정확성이 떨어진다.)자료들만 발표를 하는데 실제로 “네이쳐” 에도 실리기도 했다.
이름만 복잡한 복잡계 네트워크
위에서 말 했듯이 구조적으로만 복잡할 뿐이지 이론적으로는 복잡하지 않은 복잡계 네트워크, 실제로 복잡계 네트워크를 보면 첫눈에 보기에는 많이 복잡해 보여도 하나하나 뜯어서 살펴보면 그 내용은 꽤 간단하다. 하지만 얻을 수 있는 정보들은 큽니다. 이렇듯 복잡계 네트워크는 여러 학문 분야에서 새로운 발견이 일어날 수 있도록 해주는 새로운 도약대인 동시에 다양한 응용분야와 그 실용성으로서 현 세계에서 통일장 이론 등의 여러 미해결 난제에 대하여 실마리를 제시할 것으로 보이고, 유전자들의 조합이나 신경 조직들의 분포와 상호작용, 최적화 문제,초전도 배열이나 스핀유리와 같이 어느 한 분야에 국한되지 않고 유기적 알고리즘을 이해하고 해결한다는 점에서 꾸준히 연구되어지고 있다.
# 참고자료
참고자료
1. 연결선 분포 함수
(사진출처: http://blog.daum.net/_blog/BlogTypeView.do?blogid=0At10&articleno=16512766)
2. 구글 독감 트렌드,
(사진출처 : http://www.google.org/flutrends/intl/ko/)
3. 정하웅, 김동섭, 이해웅 (구글 신은 모든 것을 알고 있다.(1997.3.24.)),
(주)사이언스북스
4. 앨버트 바라바시, (네이버 지식백과), 2014.12.10.,
(http://terms.naver.com/entry.nhn?docId=2077766&cid=44546&categoryId=44546)
5. doc, (미술관에 숨겨진 수학을 찾아서 복잡계 네트워크 이론(2014.01.27. 23:46)),
PointOne수학과학 영재교육원 011-549-5206
(http://blog.daum.net/pointone/8002063)
6. 종수, (복잡계 네트워크 ( Complex network )(2011.11.07. 00:42)),Semantic Web Lab
# 마무리
위 포스트는 제가 직접 제작한 것 입니다.
그렇기 때문에 틀린점이나 설명이 엉성한 점이 존재할 수 있습니다.
만약 틀린점이나 설명이 엉성한 부분이 존재하면 댓글로 알려주세요.
빠른 처리 하도록 하겠습니다.
티스토리 앱으로는 댓글 이용이 불가능 하므로 웹 브라우저로 봐 주세요
(URL : http://junprogramer.tistory.com/)
읽어주셔서 감사합니다.
'잡다한 기술' 카테고리의 다른 글
[티스토리 초대장] 5월 티스토리 초대장 배포 (0) | 2018.06.07 |
---|---|
Yarn 자동 실행 또는 원격 실행 파일 만드는 방법 (0) | 2018.06.07 |
[Node.JS]비쥬얼 스튜디오(Visual studio)에서 Node.JS를 사용할 때 JSON.parse가 안되는 현상 (0) | 2018.05.29 |
우아한형제들 1차 코딩 테스트 합격 (0) | 2018.05.24 |
[알고리즘]피보나치 수열의 짝수 합 구하기 (0) | 2018.05.22 |