Как да конвертирате TXT файл в FASTA

Стъпка 1

Отворете текстовия файл с последователността на протеините, които искате да редактирате в програма за редактиране на текст, като например Notepad.

Стъпка 2

Редактирайте или добавете реда за описание, за да следвате FASTA формата. Например, > gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) е валиден описателен ред на FASTA. Този ред предоставя уникално описание на поредицата от данни, които следват. Форматът FASTA изисква използването на символ, по-голям от (>), така че програмата да може да идентифицира уникалната описателна информация и да избегне обработката на описанието като линия от данни за протеинова последователност.

Стъпка 3

Натиснете "Enter", за да въведете прекъсване на реда, след като редактирате описателния ред.

Стъпка 4

Редактирайте или добавете формата на линията за данни за протеинова последователност, за да се придържате към стандартните IUB / IUPAC кодове. Стандартът IUB / IUPAC използва букви от азбуката, за да представят приемливи кодове или разследващи последователности за аминокиселини или нуклеинови киселини във формат FASTA. Например, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE представлява валидна линия за данни, тъй като започва с буквата "Q", представляваща глутамин, и завършва с буквата "E", която представлява глутамат.

Стъпка 5

Добавете още редици от последователности от данни, редактирайте съществуващи или добавете прекъсвания на реда след 80 знака, ако е необходимо. Добавянето на стандартите за линии и прекъсванията на редовете за потока от данни FASTA гарантира, че програмата следва инструкциите, свързани с кодовете на глутамин, глутамат и други букви. Буквите в стандарта IUB / IUPAC са просто инструкции за програмата, която обработва данните във формат FASTA.

Стъпка 6

Кликнете върху "Файл", изберете и кликнете върху бутона "Запазване". Вашият TXT файл вече е във формат FASTA.