From 424e72f232e97595e96fe19c3eb59dda4aa54f0b Mon Sep 17 00:00:00 2001 From: rustam Date: Sat, 10 May 2025 15:54:28 +0300 Subject: [PATCH] two heads --- docs/maths/type-pred.md | 20 ++++++++++++++++++-- 1 file changed, 18 insertions(+), 2 deletions(-) diff --git a/docs/maths/type-pred.md b/docs/maths/type-pred.md index 6417483..c081bbc 100644 --- a/docs/maths/type-pred.md +++ b/docs/maths/type-pred.md @@ -48,11 +48,27 @@ Unix[1]. 2. Посмотреть, как выглядят эти сигнатуры; 3. Попробовать обучить простую нейросеть. +## Как считать сигнатуру файла + +Возьмем нулевую матрицу `M` размера 256х256, так как один байт это +число от 0 до 255. Считаем файл в память в виде последовательности +байтов. Теперь будем двигаться по последовательности с окном +размера 2. В этом окне первый элемент будет отвечать за номер строки, +а второй за номер столбца. И каждый раз с окном `(x, y)` будем +увеличивать элемент матрицы `M[x][y]` на единицу. + ## Причины использования Си -## Чтение файлов в память +Если **кратко**: python очень медленный. Например, средний `wav`-файл +занимает около 10 мегабайт. Это порядка десяти миллионов байт, по +которым нужно пробежать и заполнить матрицу. А для обучения нейросети, +таких файлов должно быть много. -## Как считать сигнатуру файла +**Отдельный интерес**, также, представляет возможность написать модуль +для python на C, который умеет взаимодействовать с API библиотеки +NumPy. + +## Чтение файлов в память ## Пайплайн обучения нейросети