공공지식(Public knowledge)은 누구의 소유일까


공공지식은 누구의 소유인가

[김우재의 보통과학자] 


“가장 중요한 것은 어떤 제한도 두지 않고 이 데이터를 전 세계 사람들이 사용하도록 했다는 것입니다. 인간 게놈 그 자체에는 특허를 내서도 안 되고 면허를 주어서도 안 됩니다. 또 어떤 서류에도 서명할 필요가 없습니다. 필요한 것은 인터넷을 연결하는 것뿐입니다 ”


-존 설스턴 경, 인간유전체지도의 완성을 공표하는 기자회견에서 


 

미국립생의학연구소(NBRF)에 재직할 당시의 마가렛 데이호프(왼쪽에서 두번째) 의 모습. 그는 이 곳에서 단백질의 아미노산 서열의 데이터베이스를 20년동안 구축했다. 익스페리멘터스 뮤지엄 

 

유전자은행의 설립에 관한 최초의 전문가 합의가 이루어진 1979년 록펠러미팅에서 과학자들 사이에 제기된 가장 심각한 문제는 데이터베이스를 만들 기술이나 장소가 아니라, 데이터베이스에 축적된 정보에 대한 소유권과 접근성 문제였다. 즉, 향후 유전자의 염기서열에 관한 모든 정보가 모이게 될 데이터베이스가 얼마나 공공성의 문제를 해결할 수 있는가라는 도덕적 긴장관계가, 당시 모인 모든 과학자들이 제기한 가장 중요한 사안이었던 셈이다⁠. 록펠러 미팅은 유전자 정보의 공공 데이터베이스가 설립되어야 한다는 합의에 성공했고, 과학자사회는 단일화된 창구의 디지털화된 방식이 적절하다는 결론을 내렸다. 그리고 그 무엇보다 중요한 합의는 그 데이터베이스의 소유권이 데이터베이스를 운영하는 연구소나 연구자 개인에에 주어지면 안된다는 도덕적인 결론이었다. 




록펠러 미팅 후에 유전자은행을 구체적으로 설계하고 운영할 두 곳의 연구소와 과학자 두 명이 부각되었다. 그 한 명이 미국립생의학연구소(NBRF)의 생화학자 마가렛 데이호프였고, 다른 한 명은 로스 알라모스 연구소의 물리학자 월터 고드였다.


마가렛 데이호프 - 생물학과 컴퓨터과학의 융합  

데이호프는 핵산 염기서열분석이 이루어지기 훨씬 이전부터 단백질의 아미노산 서열 데이터베이스를 구축하고 운영한 경험이 있는 선구적인 과학자였다. 화학을 박사학위를 받은 그는 도전을 즐기는 과학자였고, 당시로서는 가장 최신의 지식인 컴퓨터 알고리듬을 공부하기 위해 IBM 왓슨 연구소에서 1년간 연구를 수행한 경험도 있었다. 그 곳에서 그는 천공기로 작동하던 컴퓨터를 통해 작은 분자의 공명 에너지를 계산해 화학분야에 큰 업적을 남기고, 이론화학 연구로 조지타운대학교의 교수로 임명된다. 이미 젊은 나이에 생물물리학회의 회장까지 역임한 그는 1960년 NBRF로 옮기게 된다. 로버트 레들리가 설립한 NBRF는 워싱턴DC 외곽에 위치한 민간연구소로, 레들리 자체가 치과의사로 출발해서 이론물리학을 공부한 후에 디지털 컴퓨터에 관심을 가졌다는 사실에서 유추할 수 있듯이⁠, 생물학 연구에 컴퓨터과학을 융합시키려는 목표를 지닌 야심찬 곳이었다. 


1960년 NBRF에 합류한 데이호프는 생화학자들을 지원할 컴퓨터 알고리듬들을 만들기 시작했다. 당시 데이호프는 아미노산 서열의 데이터베이스 구축에 대부분의 시간과 열정을 쏟았는데, 1965년 그가 출판한  《단백질 서열과 구조의 도해서》라는 책은 당시 생화학자들에게는 매우 중요한 참고서적이었다⁠. 데이호프가 NBRF에 설치한 데이터베이스는 처음엔 아미노산 서열을 해독한 연구자들이 데이호프가 개발한 형식에 맞춰 데이터를 보내면, 이 데이터를 포함하는 그의 도해서 책을 선물하는 방식으로 운영되었다. 하지만 이런 방식의 선물경제는 지극히 비효율적이었고, 현장 생화학자들은 데이호프가 제안한 방식에 그다지 협조적이지 않았다. 


 

당연히 수집가에게 표본의 독점권이 주어졌던 자연사 전통과는 달리, 실험생물학자들은 서열 데이터베이스의 소유권이 누구에게도 독점되어서는 안된다고 주장했다. 위키피디아 제공




그는 이후 도해서를 자기테이프에 담아 실비를 받고 공유하는 방식으로 전환했는데, 이 방식으로 데이터베이스에 모인 아미노산 서열은 1970년 말까지 1000여개 정도였다. 1980년대에는 전화선을 이용한 모뎀 방식으로도 데이터베이스 접근이 가능해지는데, 데이호프의 데이터베이스는 훗날 유전자은행 젠뱅크나 대부분의 생명과학 데이터베이스의 원형으로 간주된다⁠. 데이호프는 아미노산 염기서열의 한글자 표기법을 개발했고, 훗날 ‘컴퓨터를 이용한 단백질 진화이론’을 만들어, 생물학의 발전에 크게 기여했다⁠. 데이호프의 선구자적인 시도들은 현재 생물정보학이 지금까지 사용하고 있는 표준으로 굳어진 경우가 많은데, 특히 그가 당시의 조악한 컴퓨터 환경에서 포트란이라는 언어로 만든 조각난 아미노산 서열을 부분적으로 겹쳐 완성된 서열로 만든 스크립트는, 지금도 생물학자들이 가장 많이 사용하는 BLAST의 초창기 모델로 사용되었다. 특히 그의 아미노산 서열 데이터베이스는 미국립보건원이 1983년 이어받아 PIR(Protein Information Resource)로 발전시켰다. 


단백질 진화에 관한 그의 이론은 또다른 여성과학자인 진화생물학자 린 마굴리스의 세포공생이론의 근거를 제시하기도 했는데, 그 이론은 바로 미토콘드리아나 엽록체가 원래는 독립적인 박테리아였다가 진핵세포와 공생하게 되었다는 유명한 진화론의 가설을 말한다⁠. 마가렛 데이호프가 활동하던 시절이 남성 과학자들이 과학을 독점하던 야만적인 시기였음을 생각해본다면, 그가 이런 업적을 이루기 위해 고군분투했던 노력은 엄청난 것이다. 여전히 미국 생물물리학회에서는 가장 뛰어난 젊은 여성과학자를 위한 상을 그의 이름으로 시상하고 있다. 


유전자은행 - 공유와 사유의 경계에서

핵산 염기서열을 저장하고 공유할 데이터베이스는 미국립보건원의 지원 없이는 불가능한 시도였다. 당연히 미국립보건원이 어떤 연구소의 손을 들어주느냐에 따라 향후 전세계 분자생물학자들이 사용할 데이터베이스의 향방이 결정될 터였다. 1980년대 초반, 미국립보건원은 염기서열 데이터베이스 운영을 두고 경쟁하던 데이호프와 월터 고드 사이에서 고드의 손을 들어주었다. 아미노산서열 데이터베이스 운영으로 20여년의 경험이 축적된 데이호프 대신 신예에 가깝던 로스 알라모스 연구소의 젠뱅크(Genbank)를 표준으로 선택한 것이다. 미국립보건원은 데이호프의 ‘축적된 경험’과 고드의 ‘미래에 대한 비전’ 사이에서 후자를 선택한 셈이다⁠. 그 이유는 바로 월터 고드가 제시한 정보공개의 투명성과 누구나 자유롭게 정보에 접근할 수 있는 개방성 때문이었다.




데이호프의 아미노산서열 데이터베이스는 자기테이프를 이용하는 단계에서도 여전히 연구자가 돈을 내고 데이터를 받는 수고를 해야 했고, 게다가 데이터를 얻은 연구자가 그 데이터를 재분배하면 안된다는 각서까지 써야 했다. 특히 이런 방식의 운영에 불만을 가진 연구자들의 참여가 줄어들면서 데이터베이스 운영이 힘들게 되자, 데이호프는 연구자들의 자발적인 기증으로 얻은 데이터를 상업적으로 판매하려고까지 했다. 그가 택한 이런 극단적 방식은 과학자사회의 결정적인 반대 목소리를 야기했다. 국민의 세금으로 연구한 공공데이터를 사익화하려던 데이호프의 데이터베이스는 연구자들의 격렬한 반대와 무관심에 직면하게 된다. 특히 자신이 만든 데이터를 데이호프가 독점하려 한다는 의심이 퍼지면서, 뛰어난 기술과 축적된 경험에도 불구하고, NBRF의 아미노산 데이터베이스 운영방법을 확장해 핵산 염기서열 데이터베이스를 구축하려던 시도는 무산되었다.


1982년 미국의 생명공학회사 제넨텍이 인공적으로 합성한 인슐린에 유전자 특허를 부여받으면서, 유전자에 대한 특허 문제는 생물학계와 사회를 떠들석하게 만들게 된다. 이후 인간유전체계획이 가속화되는 1990년대에 이르면 자신들의 연구성과로 수익을 극대화하려는 기업과 공공의 데이터에 특허를 부여할 수 없다는 시민단체 사이의 격렬한 논쟁으로 발전하게 된다⁠. 여전히 유전자 염기서열의 특허 문제는 논쟁적인 이슈이지만, 1980년대 유전자은행이 만들어지던 당시의 미국상황은 분자생물학의 전성기로 미국 대학 전체가 지식재산권 확보를 위해 노력하던 시기였다⁠. 이를 고려해보면, 당시 미국립보건원이 월터 고드의 공공데이터베이스라는 철학에 손을 들어준건 이례적인 일이다. 


(왼쪽) 생물학에 컴퓨터의 사용을 결합한 선구자 마가렛 데이호프의 모습. (오른쪽) 데이호프가 아미노산 서열을 컴퓨터에 디지털화하기 위해 만든 목걸이 구슬 모델




연구자들의 반대에도 불구하고 데이호프는 아미노산 서열 데이터베이스 모델을 핵산 염기서열 데이터베이스로 확장하려 했고, 연구자들은 데이호프와 NBRF가 서열 데이터베이스를 독점해서 학문적 업적을 갈취하려 한다고 생각했다. 데이호프의 데이터베이스는 다윈의 시대 훨씬 이전부터 수집가들이 컬렉션의 권리를 독점하는 관행을 따르고 있었다. 실제로 수많은 박물관의 표본들과 개인 수집가의 컬렉션은 여전히 권리가 독점적으로 부여된다. 하지만 자연사 전통에서는 너무도 자연스러운 지식재산권이, 실험생물학 전통에서는 부자연스럽게 인식되었다⁠. 실험생물학자 대부분은 데이호프가 고집하는 독점적이고 폐쇄적인 운영방식이 불공정하다고 생각했다⁠. 


도대체 자연사에서는 연구자들의 저항 없이 받아들여지던 수집가의 지식재산권이, 왜 유전자은행의 설립과정에서는 거부된 것일까. 유전자은행이 핵산 염기서열로 구성된 거대한 자연사 표본이라면, 지금도 전세계에 존재하는 박물관의 자연사 표본들과 유전자은행의 정보들은 어떤 측면에서 비슷하고 어떤 측면에서 차이가 나는 것일까⁠? 유전자은행의 설립과정과 두 생물학의 전통을 추적해보면, 그 답을 알 수 있을지도 모른다⁠.


※필자소개 

김우재 어린 시절부터 꿀벌, 개미 등에 관심이 많았다. 생물학과에 진학했지만 간절히 원하던 동물행동학자의 길을 자의 반 타의 반으로 포기하고 바이러스학을 전공해 박사학위를 받았다. 이후 박사후연구원으로 미국에서 초파리의 행동유전학을 연구했다. 초파리 수컷의 교미시간이 환경에 따라 어떻게 변하는지를 신경회로의 관점에서 연구하고 있다. 모두가 무시하는 이 기초연구가 인간의 시간인지를 이해하는데 도움이 될 것이라고 주장하고 다닌다. 과학자가 되는 새로운 방식의 플랫폼, 타운랩을 준비 중이다. 최근 초파리 유전학자가 바라보는 사회에 대한 책 《플라이룸》을 썼다.

동아사이언스

케이콘텐츠


 

댓글()