| arXiv | |
| | |
| <colbgcolor=#b31c1b,#b31c1b><colcolor=#fff> 설립 | <colbgcolor=#fff,#1f2023>1991년 8월 14일 |
| 설립자 | 폴 긴즈파그(Paul Ginsparg) |
| 운영 | 코넬 대학교 |
| 종류 | 학술 데이터베이스 |
| 분야 | 수학 물리학 컴퓨터과학 생물학 금융학 전기시스템공학 통계학 경제학 |
| 링크 | |
1. 개요
미국 코넬 대학교에서 운영하고 있는 오픈 액세스 프리프린트 저장소이다. arXiv라는 명칭은 일종의 리트(Leet)로 아카이브라고 읽는다. 물리학, 천문학, 전기공학, 컴퓨터과학, 정량생물학, 통계학, 수학, 금융학, 경제학 분야의 프리프린트(Preprint) 혹은 포스트프린트(Postprint) 논문을 사전 검토 후 게시한다.[1]arXiv는 1991년에 시작된 최초의 오픈 액세스 프리프린트 저장소로, 인터넷 보급 확대와 함께 등장하고 성장했다는 점에서 오픈 액세스 저널과 기원을 공유한다. 그 이전에도 프리프린트라는 개념은 존재하였으나, 주로 TeX 파일을 이메일로 주고받는 비효율적인 방식이 일반적이었다. arXiv의 설립자인 폴 긴스파그은 이러한 방식으로 쌓이는 TeX 파일을 관리하는 데 어려움을 겪었고, 이를 해결하기 위해 로스알라모스 국립 연구소(LANL) 내에 전용 FTP 서버를 구축하였는데, 이것이 arXiv의 시작이었다. 초기에는 LANL Preprint Archive라는 이름으로 운영되었으며, 이후 2001년 폴 긴스파그가 코넬 대학교로 자리를 옮기면서 현재의 arXiv라는 명칭이 정착되었다. TeX 파일을 관리하기 위한 FTP 서버가 시작이었던 만큼, arXiv는 TeX 파일 제출을 기본으로 한다. arXiv는 게시된 논문의 PDF 파일과 함께 TeX 파일 원본을 제공하기 때문에 TeX가 익숙치 않은 사람은 논문을 작성할 때 이것을 참고하면 도움이 많이 된다. 2022년부터는 DataCite와의 제휴를 통해 arXiv에 게시되는 모든 논문들에 대해 DOI가 발급되면서 인용이 많이 편해졌다. 2023년부터는 논문을 HTML 형식으로도 지원한다. 2026년 7월부터는 코넬 대학교로부터 분리되어 독립적인 비영리 기관으로 전환될 예정이라고 한다.
arXiv에 게시된 논문 가운데 상당수는 동료 평가(Peer Review)를 거치지 않은 프리프린트이므로 읽을 때 주의가 필요하다. 이러한 논문은 아직 검증 과정이 완료되지 않은 상태이기 때문에 연구 성과로도 인정 받지 못한다. 대표적으로는 2023년 상온ㆍ상압 초전도체를 개발하였다고 주장하여 화제가 되었던 LK-99 연구가 있다.# 그럼에도 불구하고 연구자들이 arXiv를 사용하는 이유는 공개 시점을 통해 아이디어에 대한 우선권을 확보할 수 있고, 심사 중인 연구라도 다른 연구자들이 쉽게 접근할 수 있도록 해주기 때문이다.[2] [3] 특히 발전 속도가 빠른 분야에서는 심사 지연으로 인해 이른바 스쿱(Scoop)을 당할 경우 에디터나 리뷰어로부터 독창성에 대한 문제 제기를 받을 수 있는데, 이때 게시해둔 프리프린트 논문이 있다면 연구의 선행성과 독창성을 입증하는 근거로 활용될 수 있다.
매우 드문 일이긴 하지만 단순히 저널 출판 과정이 번거롭다는 이유 하나만으로 논문을 정식 출판하지 않고 그냥 arXiv에 내버려 두는 연구자들도 종종 있다. 1999년 노벨물리학상 수상자인 헤라르뒤스 엇호프트와 푸앵카레 정리로 유명한 그리고리 페렐만 등이 대표적이다.
2. Endorsement
arXiv는 단순한 논문 보관소를 넘어 학자 간 커뮤니티적 성격을 갖는 플랫폼으로, 모든 제출물은 최소한의 학술적 적합성을 충족해야 한다. 이를 위해 보증(Endorsement) 시스템을 포함한 사전 검토 절차를 운영하여 비학술적이거나 부적절한 제출물을 1차적으로 걸러낸다.특히 2004년부터 도입된 보증 시스템은 신규 저자가 해당 연구 커뮤니티에 속해 있는지를 확인하기 위한 장치로, 주제 적합성, 기존 연구 이력, 학계 소속 등을 종합적으로 고려해 일부 저자에게 자동 보증을 부여한다. 자동 보증을 받은 경우에는 별도의 절차 없이 제출이 가능하지만, 자동 보증을 받지 못한 경우에는 다른 보증인으로 부터 보증을 받아야 한다.프리프린트이므로 동료 평가를 요구하지는 않지만, 보증 시스템은 최소한의 학술적 적합성을 확보하기 위한 기능을 수행한다. 따라서 보증 요청은 저자와 학문적 연관성이 있거나 제출될 작업의 내용과 적합성을 일정 수준 확인할 수 있는 보증인에게 이루어져야지, 불특정 다수를 상대로 한 무분별한 요청은 지양되어야 한다. 애초에 정상적인 연구자라면 모르는 사람에게 이러한 요청을 하지도 않고 이것을 함부로 승인해 주지도 않는다. 그럼에도 불구하고 이러한 요청이 지속적으로 발생함에 따라, AskAcademia와 같은 일부 커뮤니티에서는 이용 수칙에 "No arXiv endorsements"라고 명시해 두기도 한다.
지도교수나 동료 연구자로부터 보증을 받는 경우, 보증 절차는 다음과 같은 단계로 진행된다. 먼저 신규 저자는 논문 제출 과정에서 특정 카테고리에 보증이 필요하다는 안내를 받는다. 이에 따라 해당 분야에서 활동 중인 기존 arXiv 저자를 보증인으로 지정하여 보증을 요청한다. 이후 보증 요청은 시스템을 통해 보증인에게 전달되며, 보증인은 이메일로 제공된 승인 링크 또는 코드를 통해 이를 승인한다. 승인이 완료되면 해당 저자는 해당 카테고리에 논문을 제출할 수 있다.
과거에는 기관 이메일이 자동 보증을 판단하는 주요 기준으로 작용하여 별도의 보증 절차 없이 제출이 가능한 경우가 많았으나, 생성형 AI의 확산으로 제출량과 저품질 원고가 증가함에 따라 정책이 강화되었다. 2026년부터는 기관 이메일만으로는 충분하지 않으며, 기관 소속과 함께 해당 분야에서의 기존 저작 이력 또는 추가적인 보증을 요구하는 방식으로 변경되었다.
2.1. viXra
arXiv의 사전 검토 절차는 건전한 학술 커뮤니티를 조성하기 위한 노력이긴 하지만, 일부 아마추어 연구자들을 중심으로 이러한 정책에 대한 반발도 존재한다. 보증 시스템 역시 이러한 반발을 키운 요인 중 하나로, 이에 대한 대응으로 아마추어 연구자 필립 깁스는 2009년 viXra라는 패러디 성격의 사이트를 설립해 운영해오고 있다.# 비록 패러디에서 출발했지만 viXra 역시 독립적인 오픈 액세스 저장소로 기능하며, arXiv와 달리 별도의 심사나 기준 없이 논문 게재를 허용한다는 특징을 가지고 있다. 다만 명백한 표절에 해당하는 경우에는 게시가 거절된다. 그러나 개인이 운영하는 플랫폼이라는 한계로 인해 접근성과 신뢰성 측면에서 제약이 있으며, 최근에는 출판사들이 자체 오픈 액세스 저장소를 확대하고 있는 데다, 데이터에도 DOI를 부여할 수 있는 Zenodo와 같은 범용 플랫폼이 널리 활용되면서 이용률이 많이 저조한 편이다. 그마저도 'The Almight God' 같은 비학술적이거나 기이한 내용의 논문들이 상당수를 차지하고 있어, 초기의 취지에 비해서는 아쉬움이 남는 상황이다.3. 항목
2024년 기준으로 arXiv에는 아래와 같은 분야별 항목들이 있다.나무위키에서 arXiv가 다루는 학문을 연구했고, 20세기부터 활동한 학자 문서에서 분야의 명칭과 분류는 이 항목들을 따라서 작성했다.
===# 물리학 #===
| arXiv 물리학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 천체물리 |
|
| 응집물질 |
|
| 양자우주론 | gr-qc |
| 고에너지 (입자) | hep-ex (실험) hep-lat (격자) hep-ph (현상론) hep-th (이론) |
| 수리물리 | math-ph |
| 비선형 (통계) |
|
| 핵물리 | nucl-ex (실험) nucl-th (이론) |
| 양자물리 | quant-ph |
| 물리 |
|
===# 수학 #===
| arXiv 수학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 대수·정수 | math.AC (가환대수) math.RA (환&대수) math.GR (군론) math.RT (표현론) math.NT (정수) math.OA (연산자) math.QA (양자) math.SP (스펙트럼 이론) |
| 해석·미적분 | math.AP (PDE 해석) math.CA (ODE & 고전 해석) math.CV (복소변수) math.DS (역학계) math.FA (범함수 해석) marh.NA (수치해석) |
| 위상·기하 | math.AG (대수기하) math.AT (대수위상) math.DG (미분기하) math.GN (일반위상) math.GT (기하위상) math.KT (K 이론 및 호몰로지) math.SG (추상기하) math.MG (거리함수기하) |
| 이산 | math.CO (조합) math.OC (최적화) |
| 기초론 | math.GM (일반수학) math.LO (논리) math.CT (범주론) |
===# 통계학 #===
| arXiv 통계학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 통계학 | stat.AP (응용) stat.CO (계산) stat.ML (기계학습) stat.OT (기타) |
===# 컴퓨터과학 #===
| arXiv 컴퓨터 과학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 이론 | cs.CC (계산복잡도) cs.CG (계산기하) cs.GT (게임이론) cs.DS (자료구조 및 알고리즘) cs.LO (논리) cs.FL (형식언어 및 자동자) cs.DM (컴퓨터 이산수학) cs.CR (암호학) cs.SC (심볼릭 계산) |
| 언어 | cs.CL (계산언어) cs.PL (프로그래밍 언어) |
| 정보·네트워크 | cs.IT (정보이론) cs.NI (네트워킹 및 인터넷) cs.SI (사회 및 정보 네트워크) cs.IR (정보 검색) |
| 소프트웨어 | cs.MS (수리 소프트웨어) cs.ET (신흥기술) cs.GR (그래픽) cs.OS (운영체제) cs.SE (소프트웨어 공학) cs.DC (클러스터 컴퓨팅) cs.DB (데이터베이스) cs.DL (디지털문서고) cs.MM (멀티미디어) cs.PF (퍼포먼스) cs.SD (음향) cs.CE (금융컴퓨터공학) |
| 하드웨어 | cs.AR (아키텍쳐) cs.RO (로보틱스) |
| 인공지능 | cs.AI (인공지능) cs.LG (기계학습) cs.NE (신경망 및 진화컴퓨팅) cs.CV (컴퓨터 비전 및 패턴인식) cs.MA (멀티에이전트 시스템) |
| 기타 | cs.SY (컴퓨터 및 사회) cs.HC (인간·컴퓨터 상호작용) cs.OH (기타 컴퓨터 과학) |
===# 전기공학-시스템과학 #===
| arXiv 전기공학-시스템과학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 전기공학 | eess.AS (오디오 음성 처리) eess.IV (이미지 영상 처리) eess.SP (신호 처리) |
| 시스템 과학 | eess.SY (시스템 제어) |
===# 경제-정량금융학 #===
| arXiv 경제-정량금융학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 경제학 | econ.EM (계량) econ.GN (일반) econ.TH (이론) |
| 정량금융학 | q-fin.CP (계산) q-fin.GN (일반) q-fin.MF (수리) q-fin.PM (분산투자관리) q-fin.PR (증권가격측정) q-fin.RM (위험관리) q-fin.ST (통계) q-fin.ST (거래 및 시장미시구조) |
===# 정량생물학 #===
| arXiv 정량생물학 분야 항목 | |
| <colbgcolor=#b31c1b><colcolor=#fff> 기초·분자생물학 | q-bio.BM (생물분자) q-bio.CB (세포행동) q-bio.GN (유전학) q-bio.SC (준세포 처리) q-bio.TO (조직 및 유기질) q-bio.PE (증식 및 진화) q-bio.OT (기타 정량생물학) q-bio.QM (정량방법론) |
| 신경생물학 | q-bio.NC (신경 및 인지) q-bio.MN (분자네트워크) |
4. 여담
- arXiv에 논문을 제출하면 YYMM.XXXXX 형식으로 숫자를 부여받는다. YY는 연도, MM은 월. 2010년대 이전에는 형식이 약간 달랐다.
- 한 논문을 여러 분야에 낼 수도 있다. 이 중 한 분야를 메인으로 하고, 나머지는 cross로 한다.
- 구독을 해서 각 분야별로 올라오는 논문들을 메일로 받아볼 수 있다.
- arXiv 시간 기준으로 먼저 낼 수록 앞 순서에 나온다. 그래서 시차가 달라 제출이 어려운 시간대 임에도 앞 순서에 나오기 위해 새벽에 제출하기도 한다.
- 미국 공휴일에는 당연히 새로 논문이 올라오지 않고, 그 다음 날 한 번에 올라온다.
- pdf 대신 html로 보는 기능이 실험적으로 운영되고 있으나 상당히 불편하다.
5. 관련 문서
[1] 동료 평가(Peer Review)는 아니고 온라인 커뮤니티의 게시판 관리자처럼 각 섹션마다 모더레이터가 존재하여, 제출된 논문들을 게시하여도 문제가 없을지를 검토한다. 주제에 벗어난 내용이거나 문제가 있는 논문은 게시가 거절되거나 철회가 되기도 한다.[2] 오해하기 쉽지만 공개되지 않은 자료도 인용 자체는 가능하다. 심지어 온라인 채팅이나 전화 통화, 녹음되지 않은 개인적인 대화까지도 Personal Communications라고 하여 인용을 위한 표준 양식이 있다.[3] 다만 피인용수로 카운트 되기 위해서는 피인용수를 카운트하는 학술 데이터베이스에 포함되어 있는지가 중요하다. 가령 Google Scholar의 경우 GitHub Pages에 업로드한 논문의 인용 조차도 피인용수로 카운트 되지만 WoS는 오직 WoS 인용색인에 인덱싱된 저널의 논문에서의 인용만 피인용수로 카운트 된다.