Overview
Comment: | add Sasha's thoughts about transformation of unstructured sources like Ibn Fadlan's Risala into tabular form |
---|---|
Timelines: | family | ancestors | descendants | both | trunk |
Files: | files | file ages | folders |
SHA3-256: |
cd3bd33ee33352a0e9175ef0ee13f8fb |
User & Date: | sisrahtak on 2025-04-02 17:37:05 |
Other Links: | manifest | tags | edit |
Context
2025-04-16
| ||
15:33 | add a file with geographic coordinates (spatial.csv) that was accidentally forgotten check-in: c61fbe2bdf user: sisrahtak tags: trunk | |
2025-04-02
| ||
17:37 | add Sasha's thoughts about transformation of unstructured sources like Ibn Fadlan's Risala into tabular form check-in: cd3bd33ee3 user: sisrahtak tags: trunk | |
17:29 | add 2025 Mar 28 meeting log check-in: 5ece4833fc user: sisrahtak tags: trunk | |
Changes
Modified data/meeting_logs/2025_Mar_28.txt
from [8eab447748]
to [0695dd8ca4].
︙ | |||
42 43 44 45 46 47 48 | 42 43 44 45 46 47 48 49 50 51 | + + + | "о дублировании ID, то они у нас и так дублируются по причине того, что одно ID для ойконимов на двух (и, может, трех) языках" -- не, ID не дублируются, они уникальны для каждого входа в таблице linguistics, там, где похоже на дублирование, это на самом деле указание на номер той сущности, которая среди них главная "так, чтобы дублируемые номера сразу высвечивались" -- это можно сделать либо кастомными формулами, либо через написание специальных функций для этого, я поэкспериментирую в ближайшие дни "возможно, стоит добавить буквенных обозначений, по аналогии с руникой, например. Тогда это будет более человекочитабельно" -- добавление букв в айдишники добавит человекочитабельности, если в нашей модели данных относительно мало типов сущностей с ID. Тут стоит подумать, стоит ли оно того или этих типов и связей слишком много с самого начала и лучше как-то иначе подсвечивать связи. Не знаю пока, буду думать "о дублировании ID, то они у нас и так дублируются по причине того, что одно ID для ойконимов на двух (и, может, трех) языках" -- не, ID не дублируются, они уникальны для каждого входа в таблице linguistics AlexanderSavelyev — 01.04.2025 19:59 Идея в том, что наш топонимический проект может и должен расширяться не только в географическом отношении (от Чувашии к соседним регионам) и не только в хронологическом (от современности к более ранним топонимическим источникам). Следует понимать выполняемое сейчас как создание пространственно-временного фреймворка для изучения этноязыковой и культурной истории посредством преобразования хаотично структурированной информации в табличную форму (базы данных). Потенциально интегрирована в систему может быть не только топонимическая и шире лингвистическая информация: это и археология, и данные письменных источников. В частности, я продумывал, как могут быть таблично обработаны источники типа «Записки» ибн Фадлана о путешествии в Волжскую Булгарию. Её содержание может быть описано в таблицах: упоминаемые топонимы, этнонимы, индивиды, объекты материальной культуры, объекты нематериальной культуры. Связность системы будет обеспечена отсылками к другим её элементам: напр., от упоминаемых ибн Фадланом топонимов будут идти ссылки к соответствующим вхождениям топонимической базы, ежели тождество считается установленным. Это общая идея, детали нуждаются в проработке. |