Это не официальный сайт wikipedia.org 01.01.2023

Тензорный скетч — Википедия

Тензорный скетч

Тензорный скетч (англ. tensor sketch) — метод уменьшения размерности, используемый в статистике, машинном обучении и алгоритмах обработки больших данных[1][2]. Он особенно эффективен применительно к векторам, имеющим тензорную структуру. Такой скетч может быть использован для ускорения билинейного объединения в нейронных сетях и является краеугольным камнем во многих алгоритмах числовой линейной алгебры[3].

Тензорный скетч может использоваться для уменьшения количества переменных, необходимых для реализации билинейного пулинга в нейронной сети

ИсторияПравить

Термин тензорный скетч (эскиз) был придуман в 2013 г.[4] и в том же году описан как метод Расмусом Пегом[5].

Сначала соответствующий метод базировался на использовании быстрого преобразования Фурье, чтобы реализовать быструю свёртку аналогично отсчётному скетчу. В результате дальнейших исследований его обобщили на значительно больший класс методов уменьшения размерности с помощью случайных тензорных проекций.

Тензорные проекцииПравить

В основе одного из вариантов тензорного скетча лежит применение торцевого произведения матриц, предложенного Слюсарем В. И.[6] в 1996 г. (англ. face-splitting product)[7][8][9][10][11].

Торцевое произведение двух матриц с однаковым количеством строк C R 3 × 3   и D R 3 × 3   имеет вид[7][8][9][12]: C D = [ C 1 D 1 C 2 D 2 C 3 D 3 ] = [ C 1 , 1 D 1 , 1 C 1 , 1 D 1 , 2 C 1 , 1 D 1 , 3 C 1 , 2 D 1 , 1 C 1 , 2 D 1 , 2 C 1 , 2 D 1 , 3 C 1 , 3 D 1 , 1 C 1 , 3 D 1 , 2 C 1 , 3 D 1 , 3 C 2 , 1 D 2 , 1 C 2 , 1 D 2 , 2 C 2 , 1 D 2 , 3 C 2 , 2 D 2 , 1 C 2 , 2 D 2 , 2 C 2 , 2 D 2 , 3 C 2 , 3 D 2 , 1 C 2 , 3 D 2 , 2 C 2 , 3 D 2 , 3 C 3 , 1 D 3 , 1 C 3 , 1 D 3 , 2 C 3 , 1 D 3 , 3 C 3 , 2 D 3 , 1 C 3 , 2 D 3 , 2 C 3 , 2 D 3 , 3 C 3 , 3 D 3 , 1 C 3 , 3 D 3 , 2 C 3 , 3 D 3 , 3 ] .  

Целесообразность использования этого произведения заключается в его свойстве:

( C D ) ( x y ) = C x D y = [ ( C x ) 1 ( D y ) 1 ( C x ) 2 ( D y ) 2 ] ,  

где   — поэлементное произведение Адамара.

На этой основе произвольный тензорный скетч вида M ( y z )   можно представить как M y M z  , где матрицы M   и M   имеют меньшую размерность, и M M = M  . Поскольку операции M y   и M z   выполнимы за линейное время k d 1   и k d 2   соответственно, переход к представлению M M   позволяет выполнить умножение на векторы с тензорной структурой намного быстрее, чем формируется исходное выражение M ( y z )  , а именно за время k d = k d 1 d 2  .

Для тензоров более высокого порядка, например, x = y z t  , экономия будет ещё более значимой.

Подобное преобразование удовлетворяет лемме о малых искажениях исходных данных большой размерности.

См. такжеПравить

ПримечанияПравить

  1. Low-rank Tucker decomposition of large tensors using: Tensor Sketch  (неопр.). amath.colorado.edu. Boulder, Colorado: University of Colorado Boulder. Дата обращения: 30 июля 2020. Архивировано 14 февраля 2019 года.
  2. Ahle, Thomas; Knudsen, Jakob Almost Optimal Tensor Sketch  (неопр.). Researchgate (3 сентября 2019). Дата обращения: 11 июля 2020. Архивировано 14 июля 2020 года.
  3. Woodruff, David P. «Sketching as a Tool for Numerical Linear Algebra.» Theoretical Computer Science 10.1-2 (2014): 1-157.
  4. Ninh, Pham; Rasmus, Pagh (2013). Fast and scalable polynomial kernels via explicit feature maps. SIGKDD international conference on Knowledge discovery and data mining. Association for Computing Machinery. DOI:10.1145/2487575.2487591.
  5. Rasmus, Pagh (2013). “Compressed matrix multiplication”. ACM Transactions on Computation Theory, August 2013 Article No.: 9. Association for Computing Machinery. DOI:10.1145/2493252.2493254.
  6. Anna Esteve, Eva Boj & Josep Fortiana (2009): Interaction Terms in Distance-Based Regression, Communications in Statistics — Theory and Methods, 38:19, P. 3501 [1] Архивная копия от 26 апреля 2021 на Wayback Machine
  7. 1 2 Slyusar, V. I. (December 27, 1996). “End products in matrices in radar applications” (PDF). Radioelectronics and Communications Systems.– 1998, Vol. 41; Number 3: 50—53. Архивировано (PDF) из оригинала 2020-07-27. Дата обращения 2020-07-30. Используется устаревший параметр |deadlink= (справка)
  8. 1 2 Slyusar, V. I. Analytical model of the digital antenna array on a basis of face-splitting matrix products (англ.) // Proc. ICATT- 97, Kyiv : journal. — 1997. — 20 May. — P. 108—109. Архивировано 25 января 2020 года.
  9. 1 2 Slyusar, V. I. A Family of Face Products of Matrices and its Properties (англ.) // Cybernetics and Systems Analysis C/C of Kibernetika I Sistemnyi Analiz : journal. — 1999. — Vol. 35, no. 3. — P. 379—384. — doi:10.1007/BF02733426. Архивировано 25 января 2020 года.
  10. Slyusar, V. I. Generalized face-products of matrices in models of digital antenna arrays with nonidentical channels (англ.) // Radioelectronics and Communications Systems : journal. — 2003. — Vol. 46, no. 10. — P. 9—17. Архивировано 20 сентября 2020 года.
  11. Миночкин А.И., Рудаков В.И., Слюсар В.И. Основы военно-технических исследований. Теория и приложения. Том. 2. Синтез средств информационного обеспечения вооружения и военной техники//Под ред. А.П. Ковтуненко. - Киев: «Гранмна». – 2012.  (неопр.) C. 7 - 98; 354 - 521 (2012). Дата обращения: 30 июля 2020. Архивировано 25 января 2020 года.
  12. Slyusar, V. I. (1997-09-15). “New operations of matrices product for applications of radars” (PDF). Proc. Direct and Inverse Problems of Electromagnetic and Acoustic Wave Theory (DIPED-97), Lviv.: 73—74. Архивировано (PDF) из оригинала 2020-01-25. Дата обращения 2020-07-31. Используется устаревший параметр |deadlink= (справка)