Semantic Scholar

Semantic Scholar
	Логотип
Посилання	semanticscholar.org
Тип	Пошукова система
Автор	Інститут штучного інтелекту ім. Аллена[en]
Започатковано	2 листопада 2015
Рейтинг Alexa	758

Семантичне вчення^{[джерело?]}, англ. Semantic Scholar — це дослідницький інструмент для наукової літератури на основі штучного інтелекту, розроблений в Інституті ШІ ім. Аллена та оприлюднений у листопаді 2015 року.^[3] Він використовує досягнення в обробці природної мови для створення резюме для наукових робіт.^[4] Команда Semantic Scholar активно досліджує використання штучного інтелекту в оброблянні природної мови, машинному навчанні, взаємодії людини з комп'ютером і пошуку інформації.^[5]

Semantic Scholar починався як база даних, присвячена темам інформатики, геонауки та нейронауки.^[6] Однак у 2017 році система почала включати до свого корпусу біомедичну літературу^[en].^[6] Станом на вересень 2022 року вони налічували понад 200 мільйонів публікацій з усіх галузей науки.^[7]

Технології

Semantic Scholar надає короткий виклад наукової літератури(Scientific literature) одним реченням. Однією з його цілей було вирішення проблеми читання численних заголовків і довгих анотацій на мобільних пристроях.^[8] Цей інструмент також сприяє тому, щоб три мільйони наукових робіт, які публікуються щорічно, досягли читачів, оскільки, за оцінками, лише половина цієї літератури коли-небуть читається.^[9]

Штучний інтелект використовується для вловлення змісту публікації, генеруючи його за допомогою «абстрактної» техніки.^[4] У проекті використовується поєднання машинного навчання, обробляння природної мови та машинного бачення, щоб додати рівень семантичного аналізу до традиційних методів аналізу цитування та витягти відповідні цифри, таблиці, сутності та місця проведення з документів.^[10]^[11]

На відміну від Google Scholar і PubMed, Semantic Scholar призначено для виділення найважливіших і впливових елементів публікації.^[12] Технологія ШІ має виявляти, приховані зв'язки і зв'язки між темами досліджень.^[13] Як і раніше, цитовані пошукові системи, Semantic Scholar також використовує графові структури, які включають Microsoft Academic Knowledge Graph, Springer Nature's SciGraph і Semantic Scholar Corpus.^[14]

Кожній статті, розміщеній у Semantic Scholar, присвоюється унікальний ідентифікатор під назвою Semantic Scholar Corpus ID (скорочено S2CID). Наступний запис є прикладом:

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (March 2020). The reproductive number of COVID-19 is higher compared to SARS coronavirus. Journal of Travel Medicine. 27 (2). doi:10.1093/jtm/taaa021. PMID 32052846. {{S2CID|211099356}}.

Semantic Scholar є безкоштовним у використанні та на відміну від подібних пошукових систем (тобто Google Scholar) не шукає матеріали, які знаходяться «за стіною» платного доступу.^[15]^[6]

Одне дослідження порівнювало пошукові можливості Semantic Scholar за допомогою систематичного підходу та виявило, що пошукова система була точною на 98,88 % при спробі розкрити дані.^[15] У цьому ж дослідженні вивчалися інші функції Semantic Scholar, включно з інструменти для опитування метаданих, а також кілька інструментів цитування.^[15]

Кількість користувачів і публікацій

Станом на січень 2018 року, після проєкту 2017 року, який додав біомедичні статті та резюме тем, корпус Semantic Scholar включав понад 40 мільйонів робіт з інформатики та біомедицини.^[16] У березні 2018 року Даг Реймонд, який розробляв ініціативи машинного навчання для платформи Amazon Alexa, був найнятий для керівництва проектом Semantic Scholar.^[17] Станом на серпень 2019 року кількість включених метаданих статей (не фактичних PDF-файлів) зросла до понад 173 мільйонів^[18] після додавання записів Microsoft Academic Graph.^[19] У 2020 році партнерство між Semantic Scholar і University of Chicago Press Journals зробило всі статті, опубліковані в University of Chicago Press, доступними в корпусі Semantic Scholar.^[20] Наприкінці 2020 року Semantic Scholar проіндексувало 190 мільйонів документів.^[21]

У 2020 році кількість користувачів Semantic Scholar досягла семи мільйонів на місяць.^[8]

Див. також

Citation analysis – Examination of the frequency, patterns, and graphs of citations in documents
Citation index — Index of citations between publications
Knowledge extraction — Creation of knowledge from structured and unstructured sources
List of academic databases and search engines
Scientometrics — Study of measuring and analysing science, technology and innovation

Примітки

↑ Eunjung Cha, Ariana (3 листопада 2015). Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. The Washington Post. Архів оригіналу за 6 November 2019. Процитовано 3 листопада 2015.

↑ ^а ^б Hao, Karen (18 листопада 2020). An AI helps you summarize the latest in AI. MIT Technology Review (англ.). Процитовано 16 лютого 2021.

↑ Semantic Scholar Research. research.semanticscholar.org. Процитовано 22 листопада 2021.

↑ ^а ^б ^в Fricke, Suzanne (12 січня 2018). Semantic Scholar. Journal of the Medical Library Association (англ.). 106 (1): 145—147. doi:10.5195/jmla.2018.280. ISSN 1558-9439.

↑ Matthews, David (1 вересня 2021). Drowning in the literature? These smart software tools can help. Nature. Процитовано 5 вересня 2022. ...the publicly available corpus compiled by Semantic Scholar — a tool set up in 2015 by the Allen Institute for Artificial Intelligence in Seattle, Washington — amounting to around 200 million articles, including preprints.

↑ ^а ^б Grad, Peter (24 листопада 2020). AI tool summarizes lengthy papers in a sentence. Tech Xplore (англ.). Процитовано 16 лютого 2021.

↑ Allen Institute's Semantic Scholar now searches across 175 million academic papers. VentureBeat (амер.). 23 жовтня 2019. Процитовано 16 лютого 2021.

↑ Bohannon, John (11 листопада 2016). A computer program just ranked the most influential brain scientists of the modern era. Science. doi:10.1126/science.aal0371. Архів оригіналу за 29 квітня 2020. Процитовано 12 листопада 2016.

↑ Divvala S. PDFFigures 2.0: Mining figures from research papers — 2016.

↑ Semantic Scholar. International Journal of Language and Literary Studies. Процитовано 9 листопада 2021.

↑ Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age (англ.). Chandos Publishing. с. 91. ISBN 978-0-12-823724-3.

↑ Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mário J.; Martins, Flávio (2020). Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I (англ.). Cham, Switzerland: Springer Nature. с. 254. ISBN 978-3-030-45438-8.

↑ ^а ^б ^в Hannousse, Abdelhakim (2021). Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. IET Software (англ.). 15 (1): 126—146. doi:10.1049/sfw2.12011. ISSN 1751-8814.

↑ AI2 scales up Semantic Scholar search engine to encompass biomedical research. GeekWire (амер.). 17 жовтня 2017. Архів оригіналу за 19 січня 2018. Процитовано 18 січня 2018.

↑ Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More. GeekWire. 2 травня 2018. Архів оригіналу за 10 травня 2018. Процитовано 9 травня 2018.

↑ Semantic Scholar. Semantic Scholar. Архів оригіналу за 11 August 2019. Процитовано 11 серпня 2019.

↑ AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies. GeekWire. 5 грудня 2018. Архів оригіналу за 25 серпня 2019. Процитовано 25 серпня 2019.

↑ The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability. RCNi Company Limited (англ.). Процитовано 22 листопада 2021.

↑ Dunn, Adriana (14 грудня 2020). Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships (PDF). Semantic Scholar. Процитовано 22 листопада 2021.

Посилання

Офіційний сайт

Ця стаття є заготовкою. Ви можете допомогти проєкту, доробивши її. Це повідомлення варто замінити точнішим.

[3]

[4]

[5]

[1]

[2]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]