Struct serde_gff::parser::Parser

source ·
pub struct Parser<R: Read + Seek> { /* private fields */ }
Expand description

Реализует потоковый (наподобие SAX) парсер GFF файла. Парсер реализует интерфейс итератора по токенам. Каждый вызов метода next_token возвращает следующий токен из потока, который сразу же может быть использован для анализа или сохранен для дальнейшего использования.

События разбора

Парсер представляет собой pull-down парсер, т.е. для получения данных его нужно опрашивать внешним циклом (в противоположность push-down парсеру, который испускает события при разборе очередного элемента).

Так как GFF файл может быть представлен в XML виде, и эта структура проще для представления в тексте, то ниже показан пример файла, в котором отмечены места после которых парсер генерирует токены при разборе. В виде кода Rust описанная структура данных может быть представлена таким образом:

struct Struct;
struct Item {
  double: f64,
}
struct Root {
  int: i32,
  struc: Struct,
  list: Vec<Item>,
}

XML представление:

<STRUCT tag='4294967295'>[1]
  <FIELD label='int'[2] type='INT'>8</FIELD>[3]
  <FIELD label='struc'[4] type='STRUCT'>
    <STRUCT tag='1'>[5]
    </STRUCT>[6]
  </FIELD>
  <FIELD label='list'[7] type='LIST'>[8]
    <STRUCT tag='2'>[9]
      <FIELD label='double'[10] type='DOUBLE'>0.000000</FIELD>[11]
    </STRUCT>[12]
  </FIELD>[13]
</STRUCT>[14]

Токены, получаемые последовательным вызовом next_token:

  1. RootBegin. Прочитано описание корневой структуры – в этом состоянии уже известен тег типа структуры и количество полей в ней.
  2. Label. Прочитан индекс метки, по этому индексу может быть прочитано значение метки
  3. Value. Прочитано примитивное значение
  4. Label. Прочитан индекс метки, по этому индексу может быть прочитано значение метки
  5. StructBegin. Прочитано количество полей структуры и ее тег
  6. StructEnd
  7. Label. Прочитан индекс метки, по этому индексу может быть прочитано значение метки
  8. ListBegin. Прочитано количество элементов списка
  9. ItemBegin. Прочитано количество полей структуры, ее тег, а также предоставляется информация о порядковом индексе элемента
  10. Label. Прочитан индекс метки, по этому индексу может быть прочитано значение метки
  11. Value. Прочитан индекс большого значения (больше 4-х байт), по этому индексу само значение может быть прочитано отдельным вызовом
  12. ItemEnd. Элемент списка прочитан
  13. ListEnd. Весь список прочитан
  14. RootEnd. Файл прочитан

Пример

В данном примере читается файл с диска, и в потоковом режиме выводится на экран, формируя что-то, напоминающее JSON.

use std::fs::File;
use serde_gff::parser::Parser;
use serde_gff::parser::Token::*;

// Читаем файл с диска и создаем парсер. При создании парсер сразу же читает небольшую
// порцию данных -- заголовок, которая нужна ему для правильного разрешения ссылок
let file = File::open("test-data/all.gff").expect("test file not exist");
let mut parser = Parser::new(file).expect("reading GFF header failed");
let mut indent = 0;
loop {
  // В данном случае мы используем методы типажа Iterator для итерирования по файлу, так
  // как мы полагаем, что ошибок в процессе чтения не возникнет. Если же они интересны,
  // следует использовать метод `next_token`
  if let Some(token) = parser.next() {
    match token {
      RootBegin {..} | RootEnd => {},
      // Обрамляем структуры в `{ ... }`
      StructBegin {..} => { indent += 1; println!("{{"); },
      StructEnd        => { indent -= 1; println!("{:indent$}}}", "", indent=indent*2); },
      // Обрамляем списки в `[ ... ]`
      ListBegin {..}   => { indent += 1; println!("["); },
      ListEnd          => { indent -= 1; println!("{:indent$}]", "", indent=indent*2); },
      // Обрамляем элементы списков в `[index]: { ... }`
      ItemBegin { index, .. } => {
        println!("{:indent$}[{}]: {{", "", index, indent=indent*2);
        indent += 1;
      },
      ItemEnd => {
        indent -= 1;
        println!("{:indent$}}}", "", indent=indent*2);
      },

      Label(index) => {
        // Физически значение меток хранится в другом месте файла. Так как при итерировании они
        // могут быть нам неинтересны, то токен содержит только индекс используемой метки (имени
        // поля). В данном же случае они нас интересуют, поэтому выполняем полное чтение
        let label = parser.read_label(index).expect(&format!("can't read label {:?}", index));
        print!("{:indent$}{}: ", "", label, indent=indent*2)
      },

      // Аналогично со значениями. Некоторые значения доступны сразу (те, чей размер не превышает
      // 4 байта), другие хранятся с других частях файла и должны быть явно прочитаны.
      // Также, если вас интересует только какое-то конкретное значение, может быть использован
      // один из методов `read_*` парсера
      Value(value) => println!("{:?}", parser.read_value(value).expect("can't read value")),
    }
    continue;
  }
  // Как только итератор возвращает None, файл закончился, либо произошла ошибка; завершаем работу
  break;
}

Implementations

Создает парсер для чтения GFF файла из указанного источника данных с использованием кодировки UTF-8 для декодирования строк и генерацией ошибки в случае, если декодировать набор байт, как строку в этой кодировке, не удалось.

Параметры
  • reader: Источник данных для чтения файла

Создает парсер для чтения GFF файла из указанного источника данных с использованием указанной кодировки для декодирования строк.

Параметры
  • reader: Источник данных для чтения файла
  • encoding: Кодировка для декодирования символов в строках
  • trap: Способ обработки символов в строках, которые не удалось декодировать с использованием выбранной кодировки

Возвращает следующий токен или ошибку, если данных не осталось или при их чтении возникли проблемы.

Быстро пропускает всю внутреннюю структуру, переводя парсер в состояние, при котором вызов next_token вернет следующий структурный элемент после пропущенного (следующее поле структуры или элемент списка).

Параметры
  • token: Токен, полученный предшествующим вызовом next_token

Читает из файла значение метки по указанному индексу. Не меняет позицию чтения в файле

Читает из файла значение поля по указанному индексу. Побочный эффект – переход по указанному адресу

Читает из файла значение поля по указанному индексу. Побочный эффект – переход по указанному адресу

Читает из файла значение поля по указанному индексу. Побочный эффект – переход по указанному адресу

Читает 4 байта длины и следующие за ними байты строки, интерпретирует их в соответствии с кодировкой декодера и возвращает полученную строку. Побочный эффект – переход по указанному адресу

Читает 1 байт длины и следующие за ними байты массива, возвращает прочитанный массив, обернутый в ResRef. Побочный эффект – переход по указанному адресу

Читает из файла значение поля по указанному индексу. Побочный эффект – переход по указанному адресу

Читает 4 байта длины и следующие за ними байты массива, возвращает прочитанный массив. Побочный эффект – переход по указанному адресу

Если value содержит еще не прочитанные поля (т.е. содержащие индексы), читает их. В противном случае просто преобразует тип значения в SimpleValue.

Данный метод меняет внутреннюю позицию чтения парсера, однако это не несет за собой негативных последствий, если сразу после вызова данного метода выполнить переход к следующему токену при итерации по токенам парсера. См. пример в описании структуры Parser.

Trait Implementations

The type of the elements being iterated over.
Advances the iterator and returns the next value. Read more
Returns the bounds on the remaining length of the iterator. Read more
🔬This is a nightly-only experimental API. (iter_next_chunk)
Advances the iterator and returns an array containing the next N values. Read more
Consumes the iterator, counting the number of iterations and returning it. Read more
Consumes the iterator, returning the last element. Read more
🔬This is a nightly-only experimental API. (iter_advance_by)
Advances the iterator by n elements. Read more
Returns the nth element of the iterator. Read more
Creates an iterator starting at the same point, but stepping by the given amount at each iteration. Read more
Takes two iterators and creates a new iterator over both in sequence. Read more
‘Zips up’ two iterators into a single iterator of pairs. Read more
🔬This is a nightly-only experimental API. (iter_intersperse)
Creates a new iterator which places an item generated by separator between adjacent items of the original iterator. Read more
Takes a closure and creates an iterator which calls that closure on each element. Read more
Calls a closure on each element of an iterator. Read more
Creates an iterator which uses a closure to determine if an element should be yielded. Read more
Creates an iterator that both filters and maps. Read more
Creates an iterator which gives the current iteration count as well as the next value. Read more
Creates an iterator which can use the peek and peek_mut methods to look at the next element of the iterator without consuming it. See their documentation for more information. Read more
Creates an iterator that skips elements based on a predicate. Read more
Creates an iterator that yields elements based on a predicate. Read more
Creates an iterator that both yields elements based on a predicate and maps. Read more
Creates an iterator that skips the first n elements. Read more
Creates an iterator that yields the first n elements, or fewer if the underlying iterator ends sooner. Read more
An iterator adapter similar to fold that holds internal state and produces a new iterator. Read more
Creates an iterator that works like map, but flattens nested structure. Read more
Creates an iterator which ends after the first None. Read more
Does something with each element of an iterator, passing the value on. Read more
Borrows an iterator, rather than consuming it. Read more
Transforms an iterator into a collection. Read more
🔬This is a nightly-only experimental API. (iter_collect_into)
Collects all the items from an iterator into a collection. Read more
Consumes an iterator, creating two collections from it. Read more
🔬This is a nightly-only experimental API. (iter_is_partitioned)
Checks if the elements of this iterator are partitioned according to the given predicate, such that all those that return true precede all those that return false. Read more
An iterator method that applies a function as long as it returns successfully, producing a single, final value. Read more
An iterator method that applies a fallible function to each item in the iterator, stopping at the first error and returning that error. Read more
Folds every element into an accumulator by applying an operation, returning the final result. Read more
Reduces the elements to a single one, by repeatedly applying a reducing operation. Read more
🔬This is a nightly-only experimental API. (iterator_try_reduce)
Reduces the elements to a single one by repeatedly applying a reducing operation. If the closure returns a failure, the failure is propagated back to the caller immediately. Read more
Tests if every element of the iterator matches a predicate. Read more
Tests if any element of the iterator matches a predicate. Read more
Searches for an element of an iterator that satisfies a predicate. Read more
Applies function to the elements of iterator and returns the first non-none result. Read more
🔬This is a nightly-only experimental API. (try_find)
Applies function to the elements of iterator and returns the first true result or the first error. Read more
Searches for an element in an iterator, returning its index. Read more
Returns the element that gives the maximum value from the specified function. Read more
Returns the element that gives the maximum value with respect to the specified comparison function. Read more
Returns the element that gives the minimum value from the specified function. Read more
Returns the element that gives the minimum value with respect to the specified comparison function. Read more
Converts an iterator of pairs into a pair of containers. Read more
Creates an iterator which copies all of its elements. Read more
Creates an iterator which clones all of its elements. Read more
🔬This is a nightly-only experimental API. (iter_array_chunks)
Returns an iterator over N elements of the iterator at a time. Read more
Sums the elements of an iterator. Read more
Iterates over the entire iterator, multiplying all the elements Read more
🔬This is a nightly-only experimental API. (iter_order_by)
Lexicographically compares the elements of this Iterator with those of another with respect to the specified comparison function. Read more
Lexicographically compares the elements of this Iterator with those of another. Read more
🔬This is a nightly-only experimental API. (iter_order_by)
Lexicographically compares the elements of this Iterator with those of another with respect to the specified comparison function. Read more
Determines if the elements of this Iterator are equal to those of another. Read more
🔬This is a nightly-only experimental API. (iter_order_by)
Determines if the elements of this Iterator are equal to those of another with respect to the specified equality function. Read more
Determines if the elements of this Iterator are unequal to those of another. Read more
Determines if the elements of this Iterator are lexicographically less than those of another. Read more
Determines if the elements of this Iterator are lexicographically less or equal to those of another. Read more
Determines if the elements of this Iterator are lexicographically greater than those of another. Read more
Determines if the elements of this Iterator are lexicographically greater than or equal to those of another. Read more
🔬This is a nightly-only experimental API. (is_sorted)
Checks if the elements of this iterator are sorted using the given comparator function. Read more
🔬This is a nightly-only experimental API. (is_sorted)
Checks if the elements of this iterator are sorted using the given key extraction function. Read more

Auto Trait Implementations

Blanket Implementations

Gets the TypeId of self. Read more
Immutably borrows from an owned value. Read more
Mutably borrows from an owned value. Read more

Returns the argument unchanged.

Calls U::from(self).

That is, this conversion is whatever the implementation of From<T> for U chooses to do.

The type of the elements being iterated over.
Which kind of iterator are we turning this into?
Creates an iterator from a value. Read more
The type returned in the event of a conversion error.
Performs the conversion.
The type returned in the event of a conversion error.
Performs the conversion.