Всеобъемлющая история шаблонов. $_SERVER - Информация о сервере и среде исполнения Безжалостный user info php


Возможные атаки

Использование PHP как бинарного CGI-приложения является одним из вариантов, когда по каким-либо причинам нежелательно интегрировать PHP в веб-сервер (например Apache) в качестве модуля, либо предполагается использование таких утилит, как chroot и setuid для организации безопасного окружения во время работы скриптов. Такая установка обычно сопровождается копированием исполняемого файла PHP в директорию cgi-bin веб-сервера. CERT (организация, следящая за угрозами безопасности) CA-96.11 рекомендует не помещать какие-либо интерпретаторы в каталог cgi-bin. Даже если PHP используется как самостоятельный интерпретатор, он спроектирован так, чтобы предотвратить возможность следующих атак:

    Доступ к системным файлам: http://my.host/cgi-bin/php?/etc/passwd

    Данные, введенные в строке запроса (URL) после вопросительного знака, передаются интерпретатору как аргументы командной строки согласно CGI протоколу. Обычно интерпретаторы открывают и исполняют файл, указанный в качестве первого аргумента.

    В случае использования PHP посредством CGI-протокола он не станет интерпретировать аргументы командной строки.

    Доступ к произвольному документу на сервере: http://my.host/cgi-bin/php/secret/doc.html

    Согласно общепринятому соглашению часть пути в запрошенной странице, которая расположена после имени выполняемого модуля PHP, /secret/doc.html , используется для указания файла, который будет интерпретирован как CGI-программа Обычно, некоторые конфигурационные опции веб-сервера (например, Action для сервера Apache) используются для перенаправления документа, к примеру, для перенаправления запросов вида http://my.host/secret/script.php интерпретатору PHP. В таком случае веб-сервер вначале проверяет права доступа к директории /secret , и после этого создает перенаправленный запрос http://my.host/cgi-bin/php/secret/script.php . К сожалению, если запрос изначально задан в полном виде, проверка на наличие прав для файла /secret/script.php не выполняется, она происходит только для файла /cgi-bin/php . Таким образом, пользователь имеет возможность обратиться к /cgi-bin/php , и, как следствие, к любому защищенному документу на сервере.

    В PHP, указывая во время компиляции опцию --enable-force-cgi-redirect , а таке опции doc_root и user_dir во время выполнения скрипта, можно предотвратить подобные атаки для директорий с ограниченным доступом. Более детально приведенные опции, а также их комбинации будут рассмотрены ниже.

Вариант 1: обслуживаются только общедоступные файлы

В случае, если на вашем сервере отсутствуют файлы, доступ к которым ограничен паролем либо фильтром по IP-адресам, нет никакой необходимости использовать данные опции. Если ваш веб-сервер не разрешает выполнять перенаправления либо не имеет возможности взаимодействовать с исполняемым PHP-модулем на необходимом уровне безопасности, вы можете использовать опцию --enable-force-cgi-redirect во время сборки PHP. Но при этом вы должны убедиться, что альтернативные способы вызова скрипта, такие как непосредственно вызов http://my.host/cgi-bin/php/dir/script.php либо с переадресацией http://my.host/dir/script.php , недоступны.

В веб-сервере Apache перенаправление может быть сконфигурировано при помощи директив AddHandler и Action (описано ниже).

Вариант 2: использование --enable-force-cgi-redirect

Эта опция, указываемая во время сборки PHP, предотвращает вызов скриптов непосредственно по адресу вида http://my.host/cgi-bin/php/secretdir/script.php . Вместо этого, PHP будет обрабатывать пришедший запрос только в том случае, если он был перенаправлен веб-сервером.

Обычно перенаправление в веб-сервере Apache настраивается при помощи следующих опций:

Action php-script /cgi-bin/php AddHandler php-script .php

Эта опция проверена только для веб-сервера Apache, ее работа основывается на установке в случае перенаправления нестандартной переменной REDIRECT_STATUS , находящейся в CGI-окружении. В случае, если ваш веб-сервер не предоставляет возможности однозначно идентифицировать, является ли данный запрос перенаправленным, вы не можете использовать описываемую в данном разделе опцию и должны воспользоваться любым другим методом работы с CGI-приложениями.

Вариант 3: использование опций doc_root и user_dir

Размещение динамического контента, такого как скрипты либо любые другие исполняемые файлы, в директории веб-сервера делает его потенциально опасным. В случае, если в конфигурации сервера допущена ошибка, возможна ситуация, когда скрипты не выполняются, а отображаются в браузере, как обычные HTML-документы, что может привести к утечке конфиденциальной информации (например, паролей), либо информации, являющейся интеллектуальной собственностью. Исходя из таких соображений, многие системные администраторы предпочитают использовать для хранения скриптов отдельную директорию, работая со всеми размещенными в ней файлами по CGI-интерфейсу.

В случае, если невозможно гарантировать, что запросы не перенаправляются, как было показано в предыдущем разделе, необходимо указывать переменную doc_root, которая отличается от корневой директории веб-документов.

Вы можете установить корневую директорию для PHP-скриптов, настроив параметр doc_root в конфигурационном файле , либо установив переменную окружения PHP_DOCUMENT_ROOT . В случае, если PHP используется посредством CGI, полный путь к открываемому файлу будет построен на основании значения переменной doc_root и указанного в запросе пути. Таким образом, вы можете быть уверены, что скрипты будут выполняться только внутри указанной вами директории (кроме директории user_dir , которая описана ниже).

Еще одна используемая при настройке безопасности опция - user_dir . В случае, если переменная user_dir не установлена, путь к открываемому файлу строится относительно doc_root . Запрос вида http://my.host/~user/doc.php приводит к выполнению скрипта, находящегося не в домашнем каталоге соответствующего пользователя, а находящегося в подкаталоге doc_root скрипта ~user/doc.php (да, имя директории начинается с символа ~).

Но если переменной public_php присвоено значение, например, http://my.host/~user/doc.php , тогда в приведенном выше примере будет выполнен скрипт doc.php , находящийся в домашнем каталоге пользователя, в директории public_php . Например, если домашний каталог пользователя /home/user , будет выполнен файл /home/user/public_php/doc.php .

Установка опции user_dir происходит независимо от установки doc_root , таким образом вы можете контролировать корневую директорию веб-сервера и пользовательские директории независимо друг от друга.

Вариант 4: PHP вне дерева веб-документов

Один из способов существенно повысить уровень безопасности - поместить исполняемый модуль PHP вне дерева веб-документов, например в /usr/local/bin . Единственным недостатком такого подхода является то, что первая строка каждого скрипта должна иметь вид:

#!/usr/local/bin/php

Также необходимо сделать все файлы скриптов исполняемыми. Таким образом, скрипт будет рассматриваться так же, как и любое другое CGI-приложение, написанное на Perl, sh или любом другом скриптовом языке, который использует дописывание #! в начало файла для запуска самого себя.

Что бы внутри скрипта вы могли получить корректные значения переменных PATH_INFO и PATH_TRANSLATED , PHP должен быть сконфигурирован с опцией --enable-discard-path .



<<< Назад Содержание Вперед >>>
Есть еще вопросы или что-то непонятно - добро пожаловать на наш

Получает объект WP_User, который содержит все данные указанного пользователя.

Данные, возвращаемые функций полностью соответствуют полям таблиц БД: wp_users и wp_usermeta (описание таблиц ).

Это pluggable функция - т.е. её можно заменить из плагина. Это значит, что она будет работать (подключается) только после подключения всех плагинов, а до этого момента функция еще не определена... Поэтому нельзя вызывать эту и зависящие от неё функции прямо из кода плагина. Их нужно вызывать через хук plugins_loaded или позднее, например хук init .

Замена функции (переопределение) - в плагине можно создать функцию с таким же названием, тогда она заменит текущую функцию.

✈ 1 раз = 0.000296с = быстро | 50000 раз = 0.78с = очень быстро | PHP 7.1.2RC1, WP 4.7.2

Хуков нет.

Возвращает

WP_User/false. Объект данных или false, если не удалось найти указанного пользователя.

Использование

get_userdata($userid); $userid(число) (обязательный) ID пользователя, данные которого нужно получить.
По умолчанию: нет

Примеры

#1 Как выводить данные из полученного объекта данных

$user_info = get_userdata(1); echo "Имя пользователя: " . $user_info->user_login . "\n"; echo "Уровень доступа: " . $user_info->user_level . "\n"; echo "ID: " . $user_info->ID . "\n"; /* Выведет: Имя пользователя: admin Уровень доступа: 10 ID: 1 */

#1.2 Данные в переменную

Еще одни пример, только тут запишем данные сначала в переменные, а затем выведем из на экран:

$user = get_userdata(1); $username = $user->user_login; $first_name = $user->first_name; $last_name = $user->last_name; echo "$first_name $last_name зашел(а) на сайт под логином: $username."; /* Объект $user: WP_User Object( => stdClass Object( => 80 => kogian => $P$BJFHKJfUKyWv1TwЛОВАЕnYU0JGNsq. => kogian => [email protected] => http://example.com/ => 2016-09-01 00:34:42 => => => kogian) => 80 => Array( => 1) => wp_capabilities => Array( => subscriber) => Array( => 1 => 1 => 1) => => 1) */

#2 Методы класса

Получаемый объект с помощью get_userdata() - это экземпляр класса и у него есть методы, которые можно использовать. Иногда это может пригодится. Вот простой пример получения опции пользователя, с помощью метода $user->get() :

$user = get_userdata(1); echo $username = $user->get("user_login");

Список некоторых методов:

    get($key) - вернет значение опции;

    has_prop($key) - проверяет установлена ли указанная опция;

    has_cap($cap) - проверяет имеет ли пользователь указанную возможность или роль;

    get_role_caps() - получает все возможности роли пользователя и объединяет их с индивидуальными возможностями пользователя;

    add_role($role) - добавляет роль к пользователю;

    remove_role($role) - удаляет роль у пользователя;

  • set_role($role) - устанавливает роль пользователя;

Заметки

Вот некоторые полезные значения полей таблиц wp_users и wp_usermeta, которые вы можете использовать для получения данных:

  • display_name

user_meta

  • user_description

    wp_capabilities (массив)

    admin_color (тема админ панели. По умолчанию - свежая (fresh))

    closedpostboxes_page

  • source_domain

Также надо отметит, что с версии 3.2., возвращаемые данные немного изменились: возвращается объект WP_User . Данные в объекте разбиваются на группы: data , caps , roles (раньше данные возвращались в общем списке).

Однако, благодаря "волшебным" (служебным) методам PHP данные можно получить как и прежде, например, сейчас данные хранятся так: get_userdata(1)->data->rich_editing , но получить их можно так: get_userdata(1)->rich_editing , несмотря на то, что var_dump() не покажет эту взаимосвязь.

Код get userdata : wp-includes/pluggable.php WP 5.2.2

Иногда хочется отвлечься от текущей рутины кодирования и от небольших проблем, которым посвящается место в статьях на "деталях". Окинуть взглядом то, что делаешь долгое время. Итак, моё видение подходов к основной задаче php-программирования - генерации веб-страниц. Частично тему эту я уже затрагивал по частям - статьи про класс шаблонов и про XML вы можете найти в архиве. Теперь хотелось бы свести всё это воедино и сделать что-то монументальное. Первая часть.

1. Истоки php

С чего, собственно начался php для большинства из нас? С вставок скрипта в HTML-страницы. К примеру, собственный каталог ссылок. Страница со ссылками из определённой рубрики:

". mysql_result($result, 0). ""; mysql_free_result($result); $result = mysql_query("SELECT id, title, ratio, description, site_date FROM site WHERE rubrika=". intval($id). " ORDER BY ratio DESC, site_date DESC, title"); if (mysql_error()) echo mysql_error(); else while ($row = mysql_fetch_assoc($result)) echo "{$row}
{$row}
Записано: {$row}, рейтинг: {$row}

Просто и незатейливо, но главное, что этот код работает. Сложности начинаются, если попробовать написать название рубрики в заголовке страницы. Для этого придётся создать вставку php внутри тега , перенести туда код, выполняющий первый запрос (выборка имени рубрики), сохранять результат запроса в переменную, которую затем выводить в теле страницы.</p> <p>Следующее осложнение - попытка работать с cookies и выдавать их в зависимости от того, какие рубрики посещает пользователь. Чтобы лучше представить это: пусть мы решили, что на наш хоумпейдж пойдут толпы посетителей, и для потенциальных рекламодателей мы делаем баннерный движок с таргетингом. Скажем, пользователь, посетивший рубрики рок-музыка и музыкальные инструменты, на следующей странице увидит баннер с рекламой магазина электрогитар.</p> <p>В таком случае нам придётся сделать вставку php-кода в самом начале файла и передвинуть туда проверку наличия рубрики, ведь куки можно выдавать только до выдачи первого байта документа.</p> <p><i>Конечно, вы скажете, что это можно легко сделать при помощи механизма пользовательских сессий, что проще с точки зрения выдачи контента и безопаснее, потому что пользователь может вручную менять содержимое кук. Да, это так, но во-первых здесь представляется видение новичка программирования, делающего свою домашнюю страничку, во-вторых речь идёт о далёком прошлом - виртуально мы с вами находимся в 1998 году. </i></p> <p>Не сильно облегчает жизнь и вывод одинаковых блоков HTML- и php-кода в подключаемые файлы. Описанная выше задача - построить простой каталог ссылок с рубриками - пожалуй, верхний предел возможностей данного подхода. При выполнении более сложных задач очень велик риск столкнуться с большими трудозатратами.</p> <p>2. Усложнение кода</p> <p>Логичным развитием предыдущего подхода является полный переход на php в том смысле, что все страницы представляют собой php-код - в начале файла стоит открывающий тег "<?php", и дальше php-код не прерывается. Весь вывод делается через echo (print). Такой код, вроде бы, выглядит логичнее. Пример: страница подписки на новые ссылки в каталоге. В форме предлагается выбрать, на какие рубрики подписывается пользователь.</p><p> <?php include "db-connect.inc"; include "login-check.inc"; if (!$logged_in) { header ("Location: /register.php"); exit(); } include "page-header.inc"; print("<h2> class="club_article_small_caption">Новости для клиентов</h2> <table cellpadding=\"4\" cellspacing=\"0\" border=\"0\">"); $result = mysql_query("SELECT id, title, announce, news_date FROM news ORDER BY news_date DESC LIMIT 10"); if (mysql_error()) print(mysql_error()); else while ($row = mysql_fetch_assoc($result)) print("<tr><td>{$row}"); if ($row["news_date"] > date("Y-m-d", time() - 3600*24*14)) print("<font color=\"#cc0000\">new!</font>"); print("</td><td> <a href=\"read.php?id={$row}\"><b>{$row}</b></a> <br>{$row}</td></tr>"); print("</table>"); include "page-footer.inc"; ?> </p><p> <?php ... else while ($row = mysql_fetch_assoc($result)) print_announce($row); ... ?> </p><p>Но это нисколько не упрощает работу, и час расплаты обязательно наступит: возникнет необходимость переделать дизайн сайта. Дизайнер править такое просто откажется. Только тот, кто написал такой код, сможет в нём разобраться и заменить старый HTML на новый. Если этот человек уже не работает над проектом, то проект придётся переписывать почти с нуля или же он умрёт, превратившись в памятник человеческой недальновидности.</p> <p>Другой вариант развития подхода смешанного HTML и php. У php есть такое свойство как advanced-escaping . Он позволяет внутри языковых конструкций выводить обычный HTML-код:</p><p> <?php include "db-connect.inc"; include "login-check.inc"; if (!$logged_in) { header ("Location: /register.php"); exit(); } include "page-header.inc"; ?><h2 class="club_article_small_caption">Новости для клиентов</h2> <table cellpadding="4" cellspacing="0" border="0"><?php $result = mysql_query("SELECT id, title, announce, news_date FROM news ORDER BY news_date DESC LIMIT 10"); if (mysql_error()) print(mysql_error()); else while ($row = mysql_fetch_assoc($result)) { ?><tr><td><?=$row["news_date"]?><?php if ($row["news_date"] > date("Y-m-d", time() - 3600*24*14)) { ?><font color="#cc0000">new!</font><?php } ?></td><td> "> <b><?=$row["title"]?></b> <br><?=$row["announce"]?></td></tr><?php } ?></table><p>Верстальщик или дизайнер, открыв этот файл в HomeSite, увидят HTML-разметку с подсветкой и вполне смогут редактировать оформление страниц. В простых сайтах такой метод вполне пригоден. В сложных - ни к чёрту не годится.</p> <p>3. Переворот</p> <p>С выходом PHP 3.0... Кстати, не мешало бы восстановить хронологию, раз уж речь идёт о всеобъемлющей истории. Итак, хронология, которую удалось восстановить при помощи архива листа рассылки php announce и страницы из веб-архива :</p><p>08.1997 PHP 3.0 Beta1 06.06.1998 PHP 3.0 Release 19.07.1999 PHP 4.0 Beta1 22.05.2000 PHP 4.0 Release 10.12.2001 PHP 4.1 Release 22.04.2002 PHP 4.2 Release 10.10.2002 PHP 4.3.0pre1 (pre1 - это не бета, но ещё не Release Candidate) </p><p>Так вот, с выходом PHP 3.0 появился инструментарий для применения нового подхода в php-программировании - буферизации страниц в скриптах. (Важно заметить, что это совсем не та буферизация, которая есть сейчас .)</p> <p>Со временем задачи построения сайтов усложнялись, php использовался всё шире, сайты становились всё "динамичнее". Чем больше сайт, тем проблематичнее сделать всё на подключаемых файлах в смешанном php и HTML. Вполне логично следующим шагом расширения php стала обработка HTML-страницы в памяти скрипта и выдача её пользователю целиком или по частям.</p> <p>Реализовать данных подход помогла худо-бедно реализованная в PHP3 поддержка (ну хорошо, эмуляция) объектно-ориентированного программирования. Были созданы <i>классы шаблонов </i>, которые позволяли легко оперировать шаблоном страницы и данными, которые в него должны быть внесены.</p> <p>Это расширяло возможности программ, но одновременно требовало больше системных ресурсов. Сегодня можно сказать, что выгоды от применения такого подхода перекрыли затраты системных ресурсов, однако ещё года два-три назад много людей считало, что держать весь документ в памяти - непозволительная роскошь для веб-программирования.</p> <p>Итак, образно говоря, произошёл переворот в технологии: если раньше PHP прятался в HTML-коде и робко добавлял свою информацию, то теперь он вышел на первое место и держит весь HTML в своих лапах.</p> <p>4. Чем плохи самопальные классы шаблонов</p> <p>Спустя полгода я решил кое-что изменить в планах. Морализаторства на тему плохости самопальных классов не будет. Они хороши. Пользуйтесь ими, и прибудет с вами то, что вам нужно! Только учитывайте, что вам будут мешать некоторые обстоятельства.</p> <p>Первое. Если класс писался специально, это значит, что он несколько оторван от жизни. Пусть за классом стоит большой опыт разработок, всё равно он делался в тепличных условиях. Получившаяся технология будет иметь свои специфические условия использования, под которые придётся подгонять будущие разработки, либо переделывать класс.</p> <p>Второе. Класс, который синтезируется из наработок в разных проектах, тоже требует изменений - чем глобальнее он, тем больше.</p> <p>Итак, свои собственные классы делать можно (классы шаблонов, насколько я знаю, очень многие используют свои собственные). Если вы идёте дедуктивным методом, строя класс из оценки того, что понадобится, есть небольшая вероятность, что получится что-то гениальное. И большая вероятность, что получится не совсем то, что нужно. Можно применить индукцию - тогда после большой и долгой работы вы гарантированно получите то, что работает, но не обязательно гениальное.</p> <p>Плохость самоделок, которую я упоминал в предыдущих частях, заключается в первом случае в очень большой вероятности получить что попало, работающее не так, как вам мечталось, требующее к себе особого подхода и много кодирования. Во втором случае вы можете долго упорно работать и получить то, что уже было кем-то сделано и опубликовано до вас.</p> <p>Что касается сравнения технологий, то главный вопрос - уместность. Очень простой сайт можно делать на подключаемых файлах и не думать о классах и движках. Сайт посложнее лучше делать на шаблонах. Если сложность возрастает и на одной странице многое зависит от разных условий - меню навигации в зависимости от статуса и т.д. - лучше подумать о связке XML&XSLT.</p> <p>Пример: форум phpBB. В нём нельзя поменять оформление полностью, как вам хочется, потому что очень много элементов оформления находятся не в шаблонах, а в php-коде. Всякие формы для входа, меню управления для вошедшего пользователя и т.п. - вставляются в страницу через php-код, а не как вложенный шаблон. Cамое популярное решение - не всегда самое лучшее.</p> <p>Дмитрий Котеров так комментирует опыт изучения phpBB: написав класс шаблона, многие, будучи полны энтузиазма, начинают пихать всё под этот класс. Идея такого класса состоит в том, чтобы разделить код и оформление, но авторы phpBB наоборот перемешали их насколько это было возможно.</p> <p>Но на мой взгляд, даже при нормальной реализации этого подхода (класса шаблона) код получился бы громоздкий, файлов с шаблонами было бы очень много. В последнее время прихожу к выводу, что на классах шаблонов в принципе нельзя толком отделить php-код от данных и оформления. Со сменой дизайна сайта на таком движке обязательно придётся копаться в php-скриптах, и делать это будет не дизайнер, а вы.</p><p> <table border> <tr> <td colspan=2> <b>__global__ </b> <p> (hidden and automatically added) </td> </tr> <tr> <td><b>block1 </b></td> <td> <table border> <tr> <td colspan=2><b>block2 </b></td> </tr> <tr> <td><b>inner1 </b></td> <td><b>inner2 </b></td> </tr> </table> </td> </tr> </table> </p><p>В документации написано, что нет необходимости указывать в шаблоне, какой блок является дочерним от какого. Класс это сам поймёт.</p> <p>В документации к этому классу написано, что он знает, что inner1 - дочерний для блока block2, и нет необходимости сообщать ему об этом. Чтобы вставить данные в блок, достаточно выполнить такой код столько раз, сколько нужно строк:</p><p> <?php $tpl->setVariable(...); $tpl->parseCurrentBlock(); ?> </p><p>Чтобы внести контент в block1, нужно выполнить такое:</p><p> <?php $tpl->setCurrentBlock("inner1"); $tpl->setVariable(...); $tpl->parseCurrentBlock(); $tpl->setVariable(...); $tpl->parseCurrentBlock(); $tpl->parse("block1"); ?> </p><p>В итоге код скрипта выглядит так:</p><p> <?php $tpl = new HTML_Template_IT(); // загрузка шаблона или указание его через класс $tpl->loadTemplatefile(string filename [, boolean removeUnknownVariables, boolean removeEmptyBlocks]) // установка переменных "global", т.е. переменных, не входящих в блок (дочерний блок) $tpl->setVariable(string variablename, mixed value); // ещё один способ указания переменных - через массив $tpl->setVariable(array (string varname => mixed value)); // Будем использовать какой-нибудь блок, пусть даже глубоко вложенный в другие $tpl->setCurrentBlock(string blockname); // Повторяем столько, сколько нужно $tpl->setVariable(array (string varname => mixed value)); $tpl->parseCurrentBlock(); // получаем результат или печатаем его вызывая $tpl->show() $tpl->get(); ?> </p><p>Код удобнее и понятнее, чем с FastTemplate.</p> <p>Но многие программисты всё равно пишут свои собственные классы шаблона. Более простые, но имеющие некоторые функции, которых нет в общедоступных классах. Я писал собственный класс, в котором сделал блоки, в которые автоматически вставлялись результаты SQL-запросов, в добавок имелись шапка и хвост блока (например, теги <table> и </table>), которые появлялись в результате только если в SQL-запросе были строки.</p> <p>В PHP3 появился модуль функций обработки XML. При помощи функций этого модуля можно создавать собственных обработчики XML-кода, но, однако, нельзя проверять правильность XML-документа.</p> <p><i>Небольшой экскурс в теорию о том, что такое XML и зачем он нужен. </i></p> <p><i>XML - это способ записи структурированных данных. Под "структурированными данными" обычно подразумевают такие вещи, как электронные таблицы, адресные книги, конфигурационные параметры, финансовые транзакции, технические чертежи и так далее. XML представляет собой набор правил (вы можете также считать их инструкциями или соглашениями) для разработки текстовых форматов, которые позволят вам структурировать ваши данные. </i></p> <p>Пояснение о том, что такое структура.</p><p> <eshop> <!-- категории товаров --> <category id="3"> <title>Мясные продукты Рыба килограмм 100 Мясо килограмм 200 Отходы производства Икра рыбья килограмм 10 Растительные продукты Подсолнух штука 50

Вот так в XML можно записать структурированные данные о продовольственном магазине, в котором товары разделены на категории, а категории могут быть подчинены друг другу. Конечно, эти данные можно записывать по-другому, скажем, текст с табуляторами в качестве разделителей и с указанием id родительской категории (кстати, при записи данных в формате XML, как видно выше, его указывать не нужно). XML - это уже готовый формат для записи такой структуры, в рамках которого вам остаётся лишь придумать названия узлов (тегов) и правила, в которые должна укладываться структура (например, что товар не может быть расположен вне категории или что уровней категорий может быть не больше трёх). Далее:

XML - это не язык программирования, и вам не нужно быть программистом, чтобы использовать или изучать его. XML облегчает компьютеру задачу создания и чтения данных, обеспечивая при этом однозначность их структуры. XML позволяет избежать распространенных ошибок проектирования языков: он расширяем, независим от платформы, включает поддержку интернационализации и локализации. XML полностью совместим с Unicode .

Разработчики php предлагают обрабатывать отдельные элементы XML-документа функциями php. Пример из руководства по php:

"B", "EMPHASIS" => "I", "LITERAL" => "TT"); // Функция для начала тега (может выводить сложный текст, но в данном примере выдаёт // просто соответствующий тег). function startElement($parser, $name, $attrs) { global $map_array; if ($htmltag = $map_array[$name]) { print "<$htmltag>"; } } // Функция для конца тега function endElement($parser, $name) { global $map_array; if ($htmltag = $map_array[$name]) { print ""; } } // Функция для текста (текстового узла) function characterData($parser, $data) { print $data; } $xml_parser = xml_parser_create(); // use case-folding so we are sure to find the tag in $map_array xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, true); xml_set_element_handler($xml_parser, "startElement", "endElement"); xml_set_character_data_handler($xml_parser, "characterData"); // Чтение XML-файла if (!($fp = fopen($file, "r"))) { die("could not open XML input"); } while ($data = fread($fp, 4096)) { if (!xml_parse($xml_parser, $data, feof($fp))) { die(sprintf("XML error: %s at line %d", xml_error_string(xml_get_error_code($xml_parser)), xml_get_current_line_number($xml_parser))); } } xml_parser_free($xml_parser); ?>

Данный пример можно расширить, добавив массив имён тегов, которые будут обрабатываться иным образом, и соответствующие условия в функции startElement и endElement.

Код выглядит просто ужасно. Для использования в преобразовании XML в HTML-страницы он практически непригоден, хотя кое-где применялся, например на сайте How IT works . Конечно, можно писать собственные автоматизаторы, которые читали бы конфигурационные файлы и создавали массивы, но по суммарным трудозатратам выгоднее использовать мощные классы шаблонов, такие как Smarty.

Работа над этим проектом началась ещё в 1999 году, когда группа разработчиков начала писать спецификацию движка шаблонов. Определив, что он должен делать, разработчики пытались написать модуль на C, но в конце концов решили, что лучше сделать класс на php, доступный и понятный всем разработчикам сайтов.

Сейчас Smarty - один из проектов PHP, его сайт находится на сервере PHP по адресу smarty.php.net .

Формально Smarty - класс шаблона. На самом же деле, его функциональность на порядок выше, чем у множества *Template.

Во-первых, Smarty производит не только вставку переменных в шаблон, но и выполняет php-код в самом шаблоне. Во-вторых, шаблоны в Smarty преобразуются в php-скрипты, и всю грязную работу по вставке переменных в текст и выполнению логических конструкций отдаёт встроенному в php парсеру. Эти php-скрипты при включённом кешировании сохраняются в файлы, которые вызываются при следующих обращениях к шаблонам. Когда шаблоны меняются, скрипты генерируются снова. Такое кеширование существенно ускоряет работу скриптов.

Также Smarty умеет обрабатывать встроенные в шаблоны логические конструкции if-else, преобразуя их в php-код. Аналогично обрабатываются конструкции, названные variable modifiers. Они позволяют убрать некоторые функции из основного скрипта, перенеся их в шаблон и их кешируемые php-скрипты.

{* Написать заголовок заглавными буквами *}

{$title|upper},

{* Сократить топик до 40 символов, поставив... в конце *} Topic: {$topic|truncate:40:"..."}

Этот текст преобразуется в такой код:

_run_mod_handler("upper", true, $this->_tpl_vars["Name"]); ?> Topic: _run_mod_handler("truncate", true, $this->_tpl_vars["Name"], 40, "..."); ?>

Доступен и набор встроенных переменных таких, как $smarty.now (текущее время). Идилическую картину дополняет вывод окна отладки, содержащего значения переменных, вызов вложенных шаблонов, поддержка настраиваемых фильтров ввода/вывода и плагинов.

Всё было бы прекрасно, будь Smarty меньше в размерах. Сейчас же (версия 2.3.1) "весит" 144 килобайта и на AMD K6 266 MHz работает ощутимо медленно. Разработчики Smarty рекомендуют использовать Zend Accelerator или PHP Accelerator .

DOM - на данный момент последнее слово в шаблонах документов в php. Я описывал модуль в статье «XML: спецификация и функции DOM в PHP».

Несмотря на многословность и большой объём кода, выполняющего достаточно простые операции, DOM XML имеет большие перспективы.

Главный недостаток текстового подхода в редактировании XML-документа (редактирования в скрипте, естественно) - то, что нужно либо внимательно вчитываться в спецификицию XML, либо не быть до конца быть уверенным в том, что же получилось в итоге.

Например, вставить текст в узел - простая задача. Однако в XML-документе служебные символы и символы, не входящие в таблицу ISO, должны быть преобразованы в XML-сущности (<) или в номера символов UTF-8 (&x0442;). В модуле DOM XML достаточно сконвертировать текст в UTF-8 и вызвать метод create_text_node.

На моём сайте пока что работает старый движок, генерирующий текстовую строку, и иногда он выкидывает интересные фокусы с не-well-form-ными документами. Кроме того, объекты можно передавать как параметр функции, а имя вызываемого метода делать переменным.

Наконец, главное преимущество DOM XML - то, что бинарный модуль для текстовой обработки документа в php отсутствует. Это значит, что вам самим придётся писать парсер.

Что касается большого объёма кода, то это вполне естественно. Ведь если вы хотите редактировать документ через текст, то пишете регулярные выражения, используете набор строковых функций. Этого кода нужно тоже немало, если соблюдать условности XML.

Операции с документом через DOM нужно группировать в свои собственные функции, то есть строить DOM-овый класс шаблона.

В отдельный шаблон можно вынести общие для сайта или его разделов данные. Остальное - вставлять в документ приёмом, который я описывал:

document_element(); $child = $root1->child_nodes(); $root2 = $dom2->document_element(); for ($i = 0; $i < sizeof($child); $i++) $root2->append_child($child[$i]->clone_node()); ?>

Для сайта можно сделать простой скрипт, в который будут перенаправляться запросы к документам. В.htaccess пишется следующее:

Options FollowSymLinks RewriteEngine On # проверка наличия файла с тем же именем # и расширением phpxml для корня раздела RewriteCond %{DOCUMENT_ROOT}/$1/index.phpxml -f # если такой файл есть, правило срабатывает RewriteRule ^(+)/?$ /$1/index.php # это правило сработает для адреса, переписанного # по предыдущему правилу, и для всех остальных # файлов, отправляя запрос в скрипт composer.php. RewriteCond %{DOCUMENT_ROOT}/$1.phpxml -f RewriteRule ^(+)\.php$ /composer.php [L]

В скрипте composer.php будет открываться файл с тем же именем, что и запрашивался, но с расширением phpxml. Сервер Apache при обработке правил уже проверил факт существования этого файла.

6.1 Валидация документов

Это инструмент, который должен прийти на смену или значительно потеснить самодельные средства проверки данных. Сейчас стало модно отказываться от базы данных и хранить данные в файлах.

С базой было просто: получаешь массив и делаешь из него текстову строку (циклом или классом шаблона наподобие php-templates), либо получить строку при помощи sql2xml дерево объектов (или опять же строку). С файлом работать сложнее, потому что на всякий случай желательно проверять целостность данных.

Есть два подхода в создании разметки. Первый - разметка, ориентированная на данные (data-centric markup), второй - разметка, ориентированная на документ (document-centric markup).

Пример разметки ориентированной на данные:

ETCC FIA-organized racing series. Uses racing cars. BTCC British Touring Car Championship Analogue to ETCC, except that races take. http://btcc.co.uk DTM Deuche Tourenwagen Masters

Два уровня иерархии - строка + поле (естественно, если их станет 3 или 4, качественно ничего не изменится), в общем, то же самое, что и запрос из базы данных, отформатированный при помощи sql2xml. Пример документо-ориентированной разметки:

FIA organized about 20 racing servies, including 2 touring cars championships. European Touring Car Championship (ETCC) uses significantly tuned road cars, mostly BMW. Another FIA series is British Touring Car (BTCC) is analogue to ETCC, except that races take. Allthough, these are not the world"s most famous championships. DTM (Deuche Tourenwagen Masters), the most famous Touring racing series not only in Germany.

Этот вариант написан свободным человеческим языком, но данные в элементах acro и title остались те же, их можно получить из документа теми же запросами XPath или XQuery: /championships/championship/title Первый вариант разметки можно представить в виде таблицы базы данных. Можно усложнить его, для примера - фрагмент документа:

DTM Deuche Tourenwagen Masters Most famous German Touring racing series. Laurent Aiello Bernd Schneider Marcel Fassler Jean Alesi Cristian Albers

От этого документ не перестанет быть data-centric. Новый документ можно представить как 2 таблицы, соединяемые при запросе оператором LEFT JOIN.

Второй документ имеет более сложную структуру, и в общем случае его не получится запихать в таблицу.

Кстати, в этом заключается основное отличие XML-баз данных от не-XML. XML-database работает и с разметкой, ориентированной на документ (а не только в том, что результаты выдаются в XML). Разметку же типа data-centric вполне можно хранить в реляционной БД, а на выходе форматировать утилитой вроде sql2xml .

Так вот, возвращаясь к валидации документов, нужно заметить, что документо-ориентированную разметку очень сложно проверить на соответсвтие DTD или XML-схеме простым строковым парсером.

Ещё пример - разметка формы в моём классе TXF:

0"/>

Я проверяю это через DTD-схему. Проверка соответствия схеме документа - стандартная функция библиотеки DOM XML.

Для общеиспользуемых форматов обмена данными, например, RSS, есть спецификации и DTD-схемы (XML-схемы). Чтобы не забивать голову написанием собственного RSS-парсера, можно просто добавить в документ схему и проверить на допустимость. Затем доставать из документа нужные узлы через get_content или выражения XPath.

6.2 Лирическое отступление

Срочно завершать написание этой части серии меня заставила последняя заметка Spectator-a под названием «Шаблоны в PHP для чайников» .

Призывает забыть слова типа XML, XHTML «и прочий X...», попутно даёт заслуженного пинка Smarty, и, завершая свой ЭКСпромт, призывает умников бриться бритвой Оккама.

Бедная бритва! Подняли на знамёна её, машут ей везде, где можно, тыкают и пытаются нанести ею увечья оппонентам.

К чёрту бритву! К чёрту это дурацкое правило "не плодить сущности сверх необходимого". Это слишком избитая истина, чтобы её напоминать людям, а для того, чтобы оценивать других она вообще не годится. Количество "сверх необходимого" для каждого человека разное. Заказчик сайта может сказать: "А зачем мне ваши скрипты, сделайте в простом HTML, чтобы мы потом FrontPage-ом могли редактировать! Читали про бритву Оккама?"

Я долгое время считал, что основная причина, почему стоит использовать новые технологии в программировании - это эффект масштаба. Как мне написали в комментариях к старой статье, "с ростом объёмов сайта ты утонешь в своих шаблонах". И в своих статьях я упирал именно на это - мол, пожалуйста, балуйтесь со своим хитрым include и кодом, смешанным с HTML, оно поперёк горла встанет, когда надо будет сделать много программного кода.

На самом деле, есть ещё одна причина. Это навыки каждого конкретного человека. Кто хорошо знает XML, XSLT и XPath, либо умеет быстро находить решения задач в этой среде, тот в большем количестве случаев выполнит проект именно на XML-технологиях. Ему это сделать будет просто и легко, потому что он это хорошо умеет. Кто не знает или знает плохо - будет делать "простонародными" способами.

Остаётся лишь вопрос, будут ли его решения на XML-технологиях эффективнее, чем если бы он делал на классах шаблона или смешанном PHP&HTML? Да, будут. Приведу аллегорическое сравнение.

Вы видели, как играют в волейбол опытные игроки и "ламеры"? Команды "кульков" правдами и неправдами перекидывают мяч на другую сторону, чтобы соперник уронил мяч у себя. Нападающий удар они делать не умеют, и, руководствуясь пресловутой бритвой, играют просто. Опытный игрок намного лучше кулька умеет перекидывать мяч. Однако большего результата он добьётся, если выполнит хороший нападающий удар.




Есть еще вопросы или что-то непонятно - добро пожаловать на наш
Выбор редакции
В статье «Excel — Оптимизация таблицы» оговаривалось, что для корректной работы с таблицей в каждом ее столбце должны содержаться только...

Программа-клиент, позволяющая выкладывать файлы на «облачный» сервис и предоставлять доступ для их просмотра и загрузки всем или...

Телефоны, смартфоны и планшеты Micromax производит индийская компания Mіcromax Mobile, позиционирующаяся в отрасли потребительской...

Сегодня мы будем разбираться со Эта международная китайская компания работает с 2003 года и выпускает не только смартфоны, но и разные...
На сегодняшний день различных моделей телефонов существует огромное множество и когда встает вопрос относительно того, как выбрать...
В этой статье мы рассмотрим как можно своими силами отремонтировать монитор. Современный ЖК-монитор состоит всего из двух плат: скалера и...
Купить телефон-раскладушку модно в ближайшем магазине, торгующем средствами связи. Такой форм-фактор до сих пор очень популярен. Конечно,...
В данной статье мы рассмотрим вопрос, как скрыть друзей Вконтакте. Сегодня в социальных сетях очень много пользователей, желающих...
Пользователи часто пишут: не могу запустить компьютер, ПК загружается с многочисленными ошибками, во время его запуска появляется синий...