“갑자기 이 동영상이 왜 떠?”···사용자 입맛 따라 추천하는 알고리즘
상태바
“갑자기 이 동영상이 왜 떠?”···사용자 입맛 따라 추천하는 알고리즘
  • 취재기자 박지혜
  • 승인 2020.05.01 06:04
  • 댓글 0
이 기사를 공유합니다

알고리즘, 사용자 검색기록과 시청 영상 등 분석해 관련 동영상 추천
유튜브, 넷플릭스, 인스타그램 등 우리 일상 속 깊숙이 스며들어
좋아할 영상 추천해 흥미 유발하는 반면, ‘필터버블 현상’ 문제 발생

“오늘도 알 수 없는 유튜브 알고리즘이 날 여기로 이끌었다.”

한 네티즌이 자신의 관심사가 아닌 동영상이 유튜브에 뜨자 어리둥절하며 쓴 댓글이다. 유튜브 전성시대인 지금, 자신이 좋아하는 영상 하나를 보면, 관련 영상들이 수없이 펼쳐져 누구나 10분이 1시간으로 변해 있음을 한 번쯤 경험했을 것이다.

이는 ‘알고리즘의 원리’ 때문에 발생하는 현상이다. 알고리즘이란, 어떤 문제의 해결을 위해 절차, 방법, 명령어 등 입력된 자료를 토대로 원하는 출력을 유도해내는 플랫폼 규칙의 모음이다. 유튜브 알고리즘은 사용자가 시청했던 영상, 좋아요, 구독 등의 자료 등을 분석하여 사용자가 흥미를 가질 만한 방향의 동영상을 제공하는 시스템이다. 강은혜(22, 경남 거제시) 씨는 “동영상을 볼 때 굳이 직접 검색하지 않아도 관련 동영상을 추천해 준다”며 “자주 검색해서 보는 비슷한 종류의 영상들을 추천해 즐겁게 유튜브를 이용하고 있다”고 말했다.

유튜브에서 하나의 영상을 보면, 다음 동영상이 추천 영상으로 나타나는 모습을 볼 수 있다(사진: 유튜브 캡처).
유튜브에서 하나의 영상을 보면, 다음 동영상이 추천 영상으로 나타난다(사진: 유튜브 캡처).

그렇다면, 알고리즘은 어떤 원리에 의해서 작동하는 것일까? 크게 두 가지 방법으로 나눠볼 수 있는데, 첫 번째는 ‘콘텐츠 기반 필터링’이다. 콘텐츠 기반 필터링은 콘텐츠의 내용적 특성을 바탕으로 비슷한 콘텐츠를 추천한다. 사용자의 기록 데이터를 기반으로 사용자가 선호한 영상들을 분석해 비슷한 영상을 추천해주는 것이다. 예를 들어, 어떤 사람이 영화 <슈퍼맨>을 재밌게 봤다면, 내용적으로 비슷한 마블 영화인 히어로가 등장하는 <캡틴 아메리카> 시리즈도 사용자가 좋아할 것이라고 생각하고 추천 영상들을 제시해준다.

유튜브에서 사용자가 선호하는 영상들을 분석해 비슷한 영상을 추천하는 콘텐츠 기반 필터링에 의해 알고리즘은 작동한다(그림: 취재기자 박지혜).
유튜브에서 사용자가 선호하는 영상들을 분석해 비슷한 영상을 추천하는 콘텐츠 기반 필터링에 의해 알고리즘이 작동한다(그림: 취재기자 박지혜).

두 번째는 ‘협업 필터링’이다. 협업 필터링은 같은 성향이나 특성을 가진 사람은 비슷한 선택을 한다는 가정을 기반으로 추천하는 방식이다. 협업 필터링은 콘텐츠 기반 필터링보다 조금 더 정확성이 높지만, 기본적으로 많은 양의 데이터가 있어야 가능하기 때문에 데이터가 부족한 초기에 사용하기는 어렵다.

알고리즘이 가진 이러한 원리로 사람들은 자신의 관심 영상뿐만 아니라, 직접 찾지 않고도 비슷한 분야에서 새로운 지식을 습득할 수 있다. 또, 사람들의 취향을 저격하는 여러 가지 영상 추천을 통해 관심이 새로 생겨 특정 유튜버를 구독하기까지 한다.

알고리즘은 사람들에게 영상 추천을 통해 호기심을 자극하고, 재미를 주는 반면, 사람들에게 긍정적인 면들만 제공해주는 건 아니다. 이예진(22, 충남 천안시) 씨는 “유튜브 알고리즘은 다양한 콘텐츠들을 제시해 궁금증 해소에 많은 도움이 되지만, 추천 영상들을 끊을 수 없게 만들어 중독 현상을 일으킬 수도 있다”고 말했다. 하나의 영상만 보겠다는 게 점점 알 수 없는 알고리즘에 이끌려 한 번 빠지면 무분별하게 시간을 낭비하고 있다는 것.

보는 것만 보고, 다양한 생각을 하지 못하도록 하는 것이 추천 알고리즘의 또 다른 문제점이다. 이를 ‘필터버블 현상’이라고 한다. 필터버블 현상은 사용자 입맛에 맞는 정보만 제공하다 보니 나머지 다른 정보는 보지 못해 콘텐츠 섭취의 편식을 야기한다. “가끔은 내가 보고 싶지 않은 영상이 있을 수도 있는데, 그런 것까지 알고리즘이 추천해줄 때 불편하다”며 “다양한 주제의 영상을 보고 싶은 사람에게는 경험의 폭을 줄일 수 있다고 생각한다”고 정소희(22, 경남 양산시) 씨는 말했다.

필터버블 현상은 사용자에게 필터링된 정보만을 이용하거나 보도록 하는 콘텐츠 섭취의 편식 문제를 불러일으킨다(그림: 언론중재위원회 공감 블로그 제공).
필터버블 현상은 사용자에게 필터링된 정보만을 이용하거나 보도록 하는 콘텐츠 섭취의 편식 문제를 불러일으킨다(그림: 언론중재위원회 공감 블로그 제공).

유튜브뿐만 아니라, 알고리즘은 일상 속 다양한 곳에서도 접할 수 있다. 넷플릭스, 인스타그램 등 사람들이 자주 이용하는 콘텐츠가 대표적이다. 넷플릭스에서는 빅데이터가 사용자의 데이터를 분석하고 해석해 우리에게 딱 맞는 콘텐츠를 자동으로 추천해준다. 예를 들어, 한 사람이 A라는 영화를 시청했다면, A와 관련된 영화뿐만 아니라, A를 시청한 이력이 있는 사람이 시청한 다른 영화들까지 빅데이터가 추천해주는 것이다.

넷플릭스에서 빅데이터는 사용자가 시청한 영화, 시청한 여력이 있는 사람의 다른 영화 등 데이터를 파악해 사용자에게 맞춤형 콘텐츠를 제공한다(사진: 넷플릭스 캡처).
넷플릭스에서 빅데이터는 사용자가 시청한 영화, 시청한 여력이 있는 사람의 다른 영화 등 데이터를 파악해 사용자에게 맞춤형 콘텐츠를 제공한다(사진: 넷플릭스 캡처).

미국의 테크 미디어인 테크 크런치에 따르면, 인스타그램에 뜨는 피드 랭킹을 정하는 기준은 크게 ‘흥미', '최신', '관계’ 세 가지다. 과거 행동을 기반으로 사용자가 어떤 것을 원하는지 예측하고, 최근에 얼마나 적기 적시에 게시물을 공유했는지 파악하며, 태그하거나 사진에 노출하는 등 특정 상대와 그동안 얼마나 친밀도가 높았는지를 측정한다. 이 세 가지 기준을 토대로 사용자는 자신이 관심 있는 광고를 볼 수 있다.

인스타그램은 크게 ‘흥미, 최신, 관계’ 세 가지 기준을 토대로 인스타그램에 가장 먼저 뜰 게시물을 선택해주고 있다(출처: TechCrunch).
인스타그램은 크게 ‘흥미', '최신', '관계’ 세 가지 기준을 토대로 인스타그램에 가장 먼저 뜰 게시물을 선택해주고 있다(사진: TechCrunch).

최근에는 코로나 바이러스를 극복하기 위해 사용한 기술 중 하나가 바로 알고리즘이라는 사실이 밝혀졌다. 코로나를 추적하기 위해 알고리즘을 사용하는 다른 기술, AI를 통해 코로나 검진자들의 휴대전화 위치에서부터 공항 출발까지 모든 것을 샅샅이 뒤져서 바이러스가 발생할 수 있는 곳을 알아낼 수 있다는 것.

‘유튜브 트렌드 2020’에 따르면, 2020년 유튜브는 알고리즘이 이끈다고 할 정도로 알고리즘은 막강한 힘을 갖고 있다. 편리하고, 내 취향과 관련된 것들만 쏙쏙 잘 뽑아주고, 관련 없는 내용일지라도 사용자의 취향을 잘 파악해 맞춤형 콘텐츠를 제공해주고 있기 때문이다.

4차 산업혁명 시대에는 알고리즘이 ‘보이지 않는 손(Invisible Hand)’역할을 하게 된다. 우리는 알게 모르게 알고리즘에 종속돼있고, 우리의 뇌가 알고리즘에 의해 지배당하고 있는 것이다. 알고리즘이 인간이 생각할 수 있는 권리를 빼앗고, 기계가 모든 것을 통제하고 있는 시대에 인간의 권리는 무시되도 되는 것일까?

알고리즘은 알고리즘을 만들고 통제하는 자가 인간을 지배하게 되고, 알고리즘이 세계를 지배한다는 것은 심각한 문제다. 각 나라들은 알고리즘 폐해에 대해 조치를 취하고 있는데, 미국은 데이터 윤리 프레임워크, 영국은 데이터 사이언스 윤리체계를 통해 알고리즘의 윤리문제를 심도 있게 다루고 있다. 또, 유럽연합은 개인정보보호법(EU GDPR)을 만들어 알고리즘에 대해 일방적인 데이터 수집을 거부할 수 있고, 이의를 제기할 수 있도록 만들었다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.