Loading [MathJax]/jax/output/SVG/config.js
Сибирские электронные математические известия
Общая информация
Последний выпуск

Поиск публикаций
Поиск ссылок

Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS

Сиб. электрон. матем. изв.:

Персональный вход:
Запомнить пароль
Забыли пароль?

Сибирские электронные математические известия, 2019, том 16, страницы 1822–1832
DOI: https://doi.org/10.33048/semi.2019.16.129
(Mi semr1170)

Эта публикация цитируется в 3 научных статьях (всего в 3 статьях)

Теория вероятностей и математическая статистика

A statistical test for the Zipf's law by deviations from the Heaps' law

M. G. Chebuninab, A. P. Kovalevskiicb

a Sobolev Institute of Mathematics, 4, Koptyuga ave., Novosibirsk, 630090, Russia
b Novosibirsk State University, 1, Pirogova str., Novosibirsk, 630090, Russia
c Novosibirsk State Technical University, 20, K. Marksa ave., 630073, Novosibirsk, Russia
Список литературы:
Аннотация: We explore a probabilistic model of an artistic text: words of the text are chosen independently of each other in accordance with a discrete probability distribution on an infinite dictionary. The words are enumerated 1, 2, $\ldots$, and the probability of appearing the $i$'th word is asymptotically a power function. Bahadur proved that in this case the number of different words as a function of the length of the text, again, asymptotically behaves like a power function. On the other hand, in the applied statistics community there are statements known as the Zipf’s and Heaps’ laws that are supported by empirical observations. We highlight the links between Bahadur results and Zipf's/Heaps' laws, and introduce and analyse a corresponding statistical test.
Ключевые слова: Zipf's law, Heaps' law, weak convergence.
Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 17-01-00683_а
Сибирское отделение Российской академии наук I.1.3., project № 0314-2019-0008
The work is supported by RFBR (grant 17-01-00683) and by the program of fundamental scientific researches of the SB RAS № I.1.3., project № 0314-2019-0008.
Поступила 24 сентября 2019 г., опубликована 4 декабря 2019 г.
Реферативные базы данных:
Тип публикации: Статья
УДК: 519.233
MSC: 62F03
Язык публикации: английский
Образец цитирования: M. G. Chebunin, A. P. Kovalevskii, “A statistical test for the Zipf's law by deviations from the Heaps' law”, Сиб. электрон. матем. изв., 16 (2019), 1822–1832
Цитирование в формате AMSBIB
\by M.~G.~Chebunin, A.~P.~Kovalevskii
\paper A statistical test for the Zipf's law by deviations from the Heaps' law
\jour Сиб. электрон. матем. изв.
\yr 2019
\vol 16
\pages 1822--1832
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/semr1170
  • https://www.mathnet.ru/rus/semr/v16/p1822
  • Эта публикация цитируется в следующих 3 статьяx:
    1. Berhane Abebe, Roy Cerqueti, “Application of elementary probability models for text homogeneity and segmentation: A case study of Bible”, PLoS ONE, 19:6 (2024), e0303432  crossref
    2. M. G. Chebunin, “On the Accuracy of the Poissonisation in the Infinite Occupancy Scheme”, Sib. Electron. Math. Rep., 18:2 (2021), 1035–1045  mathnet  crossref  mathscinet  zmath  isi  scopus
    3. A. Chakrabarty, M. G. Chebunin, A. P. Kovalevskii, I. M. Pupyshev, N. S. Zakrevskaya, Q. Zhou, “A statistical test for correspondence of texts to the Zipf—Mandelbrot law”, Сиб. электрон. матем. изв., 17 (2020), 1959–1974  mathnet  crossref
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Статистика просмотров:
    Страница аннотации:330
    PDF полного текста:176
    Список литературы:45
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025