Динамические структуры данных. Программирование

Программирование >> Динамические структуры данных

1 ... 12 13 14 [ 15 ] 16 17 18 ... 38

Семинар 5. Строки и файлы

Зещача 5.2. Подсчет количества вхоз1эдений слова в текст

ностей. Длина одной из них должна составлять максимально допустимую - 80 символов.

СОВЕТ----

При вводе текста программы не ленитесь сразу же ф(фматироватъ его и снабжать комментариями.

Задача 5.2. Подсчет количества вхождений слова в текст

Написать программу, которая определяет, сколько раз встретилось заданное слово в текстовом файле, длина строки в котором не превышает 80 символов. Текст не содержит переносов слов.

На первый взгляд эта программа не сильно отличается от предыдущей: вместо факта наличия искомой последовательности в файле требуется подсчитать количество вхождений слова, то есть после первого удачного поиска не выходить из цикла просмотра, а увеличить счетчик и продолжать просмотр. В целом это верно, однако в данной задаче нам требуется найти не просто последовательность символов, а законченное слово.

Определим слово как последовательность алфавитно-цифровых символов, после которых следует знак пунктуации, разделитель или признак конца строки. Слово может находиться либо в начале строки, либо после разделителя или знака пунктуации. Это можно записать следующим образом (фигурные скобки и вертикальная черта означают выбор из альтернатив):

слово -

{начало строки знак пунктуации разделитель}

символы, составляющие слово

{конец строки знак пунктуации разделитель}

I. Исходные данные и результаты

Исходные данные:

1. Текстовый файл неизвестного размера, состоящий из строк длиной не более 80 символов. Поскольку по условию переносы отсутствуют, можно ограничиться поиском слова в каждой строке отдельно. Для ее хранения выделим строку длиной 81 символ.

2. Слово для поиска, вводимое с клавиатуры. Для его хранения также выделим строку длиной 81 символ.

Результатом работы программы является количество вхождений слова в текст. Представим его в программе в виде целой переменной.

Для хранения длины строки будем использовать именованную константу, а для хранения фактического количества символов в слове - переменную целого типа. Для работы с файлом потребуется служебная переменная соответствующего типа.

II. Алгоритм решения задачи

1. Построчно считывать текст из файла.

2. Просматривая каждую строку, искать в ней заданное слово. При каждом нахождении слова увеличивать счетчик.

Детализируем второй пункт алгоритма. Очевидно, что слово может встречаться в строке многократно, поэтому для поиска следует организовать цикл просмотра строки, который будет работать, пока происходит обнаружение в строке последовательности символов, составляющих слово.

При обнаружении совпадения с символами, составляющими слово, требуется определить, является ли оно отдельным словом, а не частью другого . Например, мы задали слово кот . Эта последовательность символов содержится, например, в словах котенок , трикотаж , трескотня и апперкот . Следовательно, требуется проверить символ, стоящий после слова, а в случае, когда слово не находится в начале строки - еще и символ перед словом. Эти символы проверяются на принадлежность множеству знаков пунктуации и разделителей. Ш. Программа и тестовые примеры Разобьем написание программы на последовательность шагов. Шаг 1. Ввести скелет программы (директивы #include, функцию main О, описание переменных, открытие файла). Добавить контрольный вывод введенного слова. Запустив программу, проверить ввод слова и успешность открытия файла. Для проверки вывода сообщения об ошибке следует выполнить программу еще раз, задав имя несуществующего файла.

#include <fstream.h> int main(){

const int 1en - 81:

char word[len]. I1ne[len]:

cout Введите слово для поиска: : cin word:

ifstream finCtext.txt . ios::in ios::rocreate):

if (!fin) { cout Ошибка открытия файла. endl: return 1: }

return 0:

Шаг 2. Добавить в программу цикл чтения из файла, внутри цикла поставить контрольный вывод считанной строки (добавляемые операторы помечены признаком комментария):

finclude <fstream.h> int ma1n(){

const Int 1en - 81:

char wordClen]. HneClen]:

cout Введите слово для поиска: : cin word:

ifstream fin( text.txt . ios::1n ios::nocreate):

if (!fin) { cout Ошибка открытия файла. endl: return 1: }

Кроме этого, слово может быть написано в разных решстрах, но мы для простоты будем искать точное совпадение. >

while (fin.getlinedine. len)) { cout line endl:

return 0:

cout Введите слово для поиска: int 1 word = strlen(word):

cin word:

ШагЗ. Добавить в программу цикл поиска последовательности символов, составляющих слово, с контрольным выводом: #include <fstream.h>

#include <string.h>

int main(){

const int len - 81:

char wordClen]. lined en]:

cout Введите слово для поиска: : cin word:

int l word - strlen(word):

ifstream fin( text.txt . ios::in ios::nocreate):

if dfin) { cout Ошибка открытия файла. endl: return 1: }

int count - 0:

while (fin.getlinedine. len)) { char *p - line: while( p - strstr(p. word)) {

cout совпадение: p endl:

p +- l word: count++:

cout count endl: return 0;

Для многократного поиска вхождения подстроки в заголовке цикла используется функция strstr. Очередной поиск должен выполняться с позиции, следующей за найденной на предыдущем проходе подстрокой. Для хранения этой позиции определяется вспомогательный указатель р, который на каждой итерации цикла наращивается на длину подстроки. Также вводится счетчик количества совпадений. На данном этапе он считает не количество слов, а количество вхождений последовательности символов, составляющих слово.

Шаг 4. Добавить в программу анализ принадлежности символов, находящихся перед словом и после него, множеству знаков пунктуации и разделителей:

#include <fstream.h> #include <string.h>

linclude <ctype.h>

int main(){ const int len = 81: char wordClen]. lineClen]:

ifstream fin( text.txt . ios::in ios:rnocreate): if (Ifin) { cout Ошибка открытия файла. endl: return 1: }

int count = 0:

while (fin.getlinedine, len)) { char *p = line: while( p = strstr(p. word)) { char *c = p: p += l word:

слово не в начале строки? if (с != line)

символ перед словом не разделитель?

if ( !ispunct(*(c -!))&& !isspace(*(c - 1) )) continue: символ после слова разделитель?

if ( ispunct(*p) II isspace(*p) (*р =- *\0) ) count++: }

cout Количество вхождений слова: count endl; return 0;

Здесь вводится служебная переменная с для хранения адреса начала вхождения подстроки. Символы, ограничивающие слово, проверяются с помощью функций ispunct и isspace, прототипы которых хранятся в заголовочном файле <ctype.h>. Символ, стоящий после слова, проверяется также на признак конца строки (для случая, когда искомое слово находится в конце строки).

Для тестирования программы требуется создать файл с текстом, в котором заданное слово встречается:

□ в начале строки;

□ в конце строки;

□ в середине строки;

□ несколько раз в одной строке;

□ как часть других слов, находящаяся в начале, середине и конце этих слов;

□ в скобках, кавычках и других разделителях.

Длина хотя бы одной из строк должна быть равна 80 символам. Для тестирования программы следует выполнить ее по крайней мере два раза: введя с,клавиатуры слово, содержащееся в файле, и слово, которого в нем нет.

Давайте теперь рассмотрим другой вариант решения этой задачи. В библиотеке есть функция strtok, которая разбивает переданную ей строку на лексемы в соответствии с заданным набором разделителей. Если мы воспользуемся этой функцией, нам не придется вручную вьщелять и проверять начало и конец слова.

потребуется лишь сравнить с искомым словом слово, выделенное с помощью strtok. Правда, список разделителей придется задать вручную: linclude <fstream.h> linclude <string.h> int niain(){ const int len - 81: char word[len]. line[len]: char delims[] = ..!? /o)(*::\ : cout Введите слово для поиска: : cin word:

ifstream fin( text.txt . ios::in ios::nocreate):

if (!fin) { cout Ошибка открытия файла. endl: return 1: }

char *token: int count = 0:

while (fin.getlinedine. len)) { token - strtok( line, delims ): while( token !- NULL ) {

if ( Istrcmp (token, word) )count++:

token - strtok( NULL, delims ):

cout Количество вхождений слова: count endl: return 0:

Первый вызов функции strtok в операторе 1 формирует адрес первой лексемы (слова) строки line. Он сохраняется в переменной token. Функция strtok заменяет на NULL разделитель, находящийся после найденного слова, поэтому в операторе 2 можно сравнить на равенство искомое и выделенное слово. В операторе 3 выполняется поиск следующей лексемы в той же строке. Для этого следует задать в функции strtok в качестве первого параметра NULL.

Как видите, программа стала короче и яснее. На этом примере можно видеть, что средства, предоставляемые языком, влияют на алгоритм решения задачи, и поэтому перед тем, как продумывать алгоритм, необходимо эти средства изучить. Представьте, во что бы вылилась программа без использования функций работы со строками и символами!

Задача 5.3. Вывод вопросительных предложений

Написать программу, которая считывает текст из файла и выводит на экран только вопросительные предложения из этого текста. I. Исходные данные и результаты

Исходные данные: текстовый файл неизвестного размера, состоящий из неизвестного количества предложений. Предложение может занимать несколько строк.

поэтому ограничиться буфером на одну строку в данной задаче нельзя. Примем решение выделить буфер, в который поместится весь файл.

Результаты являются частью исходных данных, поэтому дополнительного пространства под них выделять не требуется.

Будем хранить длину файла в переменной длинного целого типа. Для организации вывода предложений понадобятся переменные того же типа, хранящие позиции начала и конца предложения.

П. Алгоритм решения задачи

1. Открыть файл.

2. Определить его длину в байтах.

3. Выделить в динамической памяти буфер соответствующего размера.

4. Считать файл с диска в буфер.

5. Анализируя буфер посимвольно, выделять предложения. Если предложение оканчивается вопросительным знаком, вывести его на экран.

Детализируем последний пункт алгоритма. Для вывода предложения необходимо хранить позиции его начала и конца. Предложение может оканчиваться точкой, восклицательным или вопросительным знаком. В первых двух случаях предложение пропускается. Это выражается в том, что значение позиции начала предложения обновляется. Оно устанавливается равным символу, следующему за текущим, и просмотр продолжается. В случае обнаружения вопросительного знака предложение выводится на экран, после чего также устанавливается новое значение позиции начала предложения.

111. Программа и тестовые примеры

Ниже приводится текст программы. Рекомендуем вам самостоятельно разбить его для отладки на последовательность шагов аналогично предыдущим примерам, вставляя и удаляя отладочную печать. Файл с тестовым примером должен содержать предложения различной длины (от нескольких символов до нескольких строк), в том числе и вопросительные.

#include <fstream.h> #include <stdio.h> int main(){

ifstream fin( text.txt . ios::in ios::nocreate):

if (!fin) { cout Ошибка открытия файла. endl: return 1: }

fin.seekg(0. ios::end): long len - fin.tellgO: char *buf - new char [len fin.seekg(0. ios::beg): fin.read(buf. len): bufClen] - ЧО: long n - 0. i - 0. j - 0: while(buf[i]) { if( buf[i] - ? ) {

1 ... 12 13 14 [ 15 ] 16 17 18 ... 38