Изучаем Perl. Глава 5
Изучаем Perl. Глава 5
Строковые функции
Сейчас мы рассмотрим строковые функции. С помощью этих функций вы можете определить длину строки,
произвести поиск подстроки или поменять местами символы в строке. Ниже приведены строковые
функции, имеющиеся в Perl:
chomp (string),
chomp (array) использует значение специальной переменной $/ для последнего символа строки
string или каждого элемента массива array. Последний символ будет удален только в том случае,
если он равен значению переменой $/.
chop (string),
chop (array) делает то же самое, что и предыдущая функция, но в качестве результата эта
функция возвращает сам удаленный символ.
chr (number) возвращает символ из ASCII-таблицы с кодом number. Например, chr(65) возвратит
символ 'A'.
crypt (string1, string2) шифрует строку string1. Perl не предоставляет механизмов для дешифрования
строки.
index (string, substring, position) возвращает позицию первого вхождения строки substring в
строке string считая от позиции position. Если параметр position не задан, то сравнение строк
ведется от начала строки string.
join (string, array) возвращает строку, в которой все элементы массива array соединены строкой
string. Например, join (">>", ("a","b","c")) возвратит строку "a>>b>>c";
lc (string) возвратит строку, где все символы прописные. Например, lc ("ABCD") возвратит "abcd"
lcfirst (string) возвратит строку, в которой только первый символ прописной. Например,
lcfirst ("ABCD") возвратит "aBCD"
length (string) возвращает длину строки.
rindex (string, substring, position) то же, что и index (смотрите выше), но возвращает позицию
последнего вхождения.
split (pattern, string, limit) разбивает строку string на части, принимая за границу значение
параметра pattern. Например, ($a, $b, $c) = split ("::", "1::2::3") присвоит переменным
$a, $b, $c значения "1", "2", "3" соответственно. Если же результат используется в скалярном
контексте, то функция возвращает количество найденных таким образом элементов.
substr (string, offset, length) возвращает часть строки string, как определено параметрами
offset (смещение) и length (длина). Если length не указан, возвращается все, что находится на
промежутке от offset до конца string. Отрицательные значения offset могут использоваться
для сканирования с правого края строки string.
uc (string) то же самое, что и lc (смотрите выше), но все символы заглавные.
ucfirst (string) то же самое, что lcfirst (смотрите выше), но символ заглавный.
В случае, если Perl встречает число там, где ожидает встретить строку, он просто преобразовывает
число в строку, освобождая вас от дополнительной работы.
Некоторые функции из приведенных выше используют для своей работы специальную переменную $_, о
которой вы узнаете в главе 9 "Файлы" и главе 12 "Использование специальных переменных".
Следующие несколько примеров демонстрируют применение некоторых строковых функций. После
того, как вы поймете работу нескольких строковых функций, вы сможете правильно применять
и остальные.
Пример: изменение значения строки
Очень часто вам, возможно, понадобится изменять части строк - как правило, где-то в середине
строки. Когда перед вами станет такая задача, вы можете воспользоваться функцией substr().
Обычно эта функция используется для получения строки из существующей строки - на основании
трех параметров - исходной строки, смещения, которое есть начало новой строки и длины новой
строки.
$firstVar = substr("0123BBB789", 4, 3);
print("firstVar = $firstVarn");
Программа напечатает:
firstVar = BBB
Функция возвратит строку, начиная с 5-го символа, и длиной в 3 символа.
Применение данной функции становится гораздо более интересным, когда вы используете ее слева
от оператора присваивания:
$firstVar = "0123BBB789";
substr($firstVar, 4, 3) = "AAA";
print("firstVar = $firstVarn");
Программа напечатает:
firstVar = 0123AAA789
Пример: поиск строки
Другая интересная задача, которую вы можете решить с помощью строковх функций - это поиск заданной
подстроки в строке. Например, у вас есть полное имя файла, включая путь:
"C:\WINDOWS \TEMP\WSREWE.DAT", а вам нужно получить из него только имя файла. Вы можете
это сделать, найдя последний обратный слеш (символ ''), а за тем применив функцию substr().
Помните, что в строке для указания символа '' вы должны использовать двойной символ '\'.
Если вы подзабыли материал, обратитесь к главе 2 "Числовые и стринговые литералы".
$pathName = "C:\WINDOWS\TEMP\WSREWE.DAT";
$position = rindex($pathName, "\") + 1;
$fileName = substr($pathName, $position);
print("$fileNamen");
Программа напечатает:
WSREWE.DAT
Мы не указали здесь третий параметр функции substr() - length, - это потому что нам нужно
взять подстроку до конца исходной строки.
Функции для работы с массивами.
Массивы - это большая часть Perl и Perl может вам предложить много функций для работы с ними.
Функции, которые вы можете использовать для работы с массивами:
defined (variable) возвращает true если variable имеет действительное значение, и false
если variable пока не было присвоено значение. Это относится не только к массивам, данные
любого типа могут быть проверены таким образом. В отношении подобных операций с ключами
ассоциативных массивов смотрите функцию exists().
delete (key) удаляет пару "ключ-значение" из данного ассоциативного массива. Если вы удалите
подобным образом значение из массива окружения %ENV, то изменится окружение только текущего
процесса.
each (assoc_array) возвращает двухэлементый список, содержащий ключ и значение из заданного
ассоциативного массива. Если уже был прочитан последний элемент массива, возвращается пустой
список.
exists (key) возвращает true, если key является ключем заданного ассоциативного массива. Например,
exists ($array("Orange")) возвратит true, если ассоциативный массив %array имеет ключ со значением
"Orange".
join (string, array) возвращает строку, в которой все элементы массива array соединены строкой
string. Например, join (">>", ("a","b","c")) возвратит строку "a>>b>>c".
keys (assoc_array) возвращает список всех ключей, имеющихся в заданном ассоциативном массиве.
Список не составляется в каком-либо определенном порядке.
map (expression, array) вычисляет выражение expression для каждого элемента массива array.
Специальная переменная $ присваивается каждому элементу массива array перед вычислением
выражения expression.
pack (string, array) создает бинарную структуру, используя string как шаблон, массива array.
Подробнее смотрите в главе 8 "Ссылки".
pop (array) возвращает последнее значение массива array, уменьшая его размер на единицу.
push (array1, array2) добавляет содержимое массива array1 к массиву array2, изменяя размер
массива array1 должным образом.
reverse (array) когда используется в контексте массива, изменяет порядок следования элементов
массива на противоположный. Когда же использется в скалярном контексте, массив преобразуется
в строку, а уже строка подвергается реверсивному изменению.
scalar (array) рассматривает массив как скаляр и возвращает количество элементов в массиве.
shift (array) возвращает первое значение массива array, уменьшая его размер на единицу.
sort (array) возвращает список, содержащий элементы массива array, отсортированные в заданном
порядке. Подробнее смотрите главу 8 "Ссылки".
splice (array1, offset, length, array2) заменяет элементы массива array1 элементами массива
array2. Возвращает список, содержащий все элементы, которые были удалены.
split (pattern, string, limit) разбивает строку string на части, принимая за границу значение
параметра pattern. Например, ($a, $b, $c) = split ("::", "1::2::3") присвоит переменным
$a, $b, $c значения "1", "2", "3" соответственно. Если же результат используется в скалярном
контексте, то функция возвращает количество найденных таким образом элементов.
undef (variable) всегда возвращает неопределенное значение. Кроме того, "разопределяет"
переменную variable, которая должна быть скаляром, целым массивом или именем подпрограммы.
unpack (string, array) совершает действия, полностью противоположные деяниям функции pack()
- смотрите выше.
unshift (array1, array2) добавляет элементы массива array1 к началу массива array2. Добавляемые
элементы сохраняют оригинальный порядок. Возвращает новый размер массива array1.
values (assoc_array) возвращает все значения заданного ассоциативного массива. Возвращаемый
список не формируется в каком-либо определенном порядке.
Как и в случае со строковыми функциями, мы рассмотрим в примерах только несколько функций
для работы с массивами.
Пример: печать ассоциативного массива.
Как мы уже знаем, функция each() возвращает пару ключ-значение ассоциативного массива. Это
называется итерацией элементов массива. То есть, функция начинает работу от начала массива,
и заканчивает только в случае достижения конца массива.
%array = ( "100", "Green", "200", "Orange");
while (($key, $value) = each(%array)) {
print("$key = $valuen");
}
Программа напечатает:
100 = Green
200 = Orange
По достижении конца массива, функция возвращает false.
Пример: проверка существования элемента массива
Перед тем как присваивать какому-либо элементу массива значение, вы можете проверить - существует
ли вообще данный элемент - с помощью функции defined(). Это очень удобно если вы, например,
читаете какие-либо значения с диска, и не хотите перезаписывать ими те значения, которые уже
содержатся в памяти. Предположим, у вас имеется база данных с адресами клиентов, и вы хотите
удостовериться, что в ней нет дубликатов. Вы считываете с диска адреса один за одним, и
записываете их в качестве значений в ассоциативный массив, используя имена клиентов как ключи
массива. Если имя клиента как ключ массива уже имеется в массиве, то его новый адрес помечается.
Поскольку мы ще не говорили о работе с файлами, то нам потребуется эмулировать работу с диском.
И вместо адресов клиентов мы будем использовать номер клиента в паре с его именем. Сначала мы
посмотрим, что получится когда в ассоциативном массиве два занчения имеют один ключ.
createPair("100", "Kathy Jones");
createPair("200", "Grace Kelly");
createPair("100", "George Orwell");
while (($key, $value) = each %array) {
print("$key, $valuen");
};
sub createPair{
my($key, $value) = @_ ;
$array{$key} = $value;
};
Программа напечатает:
100, George Orwell
200, Grace Kelly
Как вы видите, первая пара массива была перезаписана третьей парой. Таким образом, чтобы избежать
ошибок, нам нужно иметь возможность достоверно проверить - нет ли в массиве уже такого ключа,
который мы собираемся использовать. Следующая программа показывает, как это делается:
createPair("100", "Kathy Jones");
createPair("200", "Grace Kelly");
createPair("100", "George Orwell");
while (($key, $value) = each %array) {
print("$key, $valuen");
};
sub createPair{
my($key, $value) = @_ ;
while (defined($array{$key})) {
$key++;
}
$array{$key} = $value;
};
Программа напечатает:
100, George Orwell
101, Kathy Jones
200, Grace Kelly
Как вы видите, программа заметила, что ключ "100" уже существует, и новые данные добавила в
массив с ключем "101". Если бы, например, ключ "101" уже существовал в массиве, то новые
данные таким образом добавились бы с ключем "102".
Андрей Сергиенко
e-mail - erazer@erazer.virtualave.net">erazer@erazer.virtualave.net
site - //erazer.virtualave.net
|