Василиса▶ Я жду вашего обращения. Что Вы хотите узнать?
Логотип
Уникальное обозначение: создание контента для интеллектуального поисковика ( страница )
страница
текст:

Создание контента для интеллектуального поисковика

Дневник реализации. (bts1003)

<2017.10.01 Диафильмы>
Отдельно начат дневник для создания контента диафильмов
< /2017.10.01 Диафильмы>

<2016.09.18 Диафильмы>
Из Бд диафильмов с http://diafilmy.su/ считано 3035 диафильмов
делаем скрипт для новых с 3036-3465
нашли источник с http://arch.rgdb.ru
технология загрузки в ~/work/d/dd_arch.txt
< /2016.09.18 Диафильмы>

План
  1. Книги Концепция формирования контента для книг: Контент находится в трех ресурсных файлах. 1 - комъекты с описанием книги (без текста и без иллюстраций) (предварительный этап составления каталога книг) 2 - комъекты с описанием книги с текстом и иллюстрациями (законченный контент) 3 - фрагмент из 1 для чтения текста и иллюстраций процедура включения новой книги в контент проходит по следующему алгоритму: 1. для кондидата на включение в библиотеку составляется комъект с описанием 2. проверяется наличие в ресурсе 2 если да кондидат отвергается если нет проверяется наличие в ресурсе 1 если да кондидат отвергается если нет проверяется в наличие в ресурсе 3 (если ресурс три есть на текущий момент) если нет включается в ресурс 1. 3. из ресурса 1 выделенная часть передается в ресурс 3 4. из ресурса 3 каждый комъект обрабатывается (читается текст, читаются иллюстрации) формируется ресурс 3.1 и затем полностью добавляется в ресурс 2 очищая одновременно ресурс 3 и 3.1 ======================= программирум процедуру составления описания иллюстраций из текста книг ресурса 2 для возможности независимого получения описаний иилюстраций от формирования контента книг все скрипты для контента книг начинаются с book_ просиматриваются следующие скрипты: book_read_des - чтение в навал с произвольного сайта описание книги и перевод его в комъект book_check_r - проверка комъекта на наличие его в ресурсах 1,2,3 book_read_txt_1 - чтение текста для одного комъекта book_read_txt_r3 - обработка ресурса 3 и включение его в ресурс 2
  2. Диафильмы Дневник для создания контента диафильмов
  3. Персоны
    ~/work/tmp/url_sort_prs.all
  4. Анекдоты
  5. Фразеологизмы
  6. Сказки
  7. Пословицы
  8. Реки
    ~/work/tmp/url_sort_riv.all
  9. Басни
  10. Мультфильмы
    ~/work/tmp/url_sort_mfl.all
  11. Фильмы
    ~/work/tmp/url_sort_flm.all
  12. Песни
  13. Картины
    ~/work/tmp/url_sort_pic.all
  14. Кулинарные рецепты
      источники:
    1. Лучшие Кулинарные рецепты ( книга )
  15. Товары
  16. Медицинские термины
  17. БСЭ
  18. Словари
  19. Лекарства
    ~/work/tmp/url_sort_lek.all
  20. Растения
  21. Животные
  22. Грибы
    ~/work/tmp/url_sort_grb.all
  23. Заболевания
    ~/work/tmp/url_sort_zab.all
  24. Сражения
    ~/work/tmp/url_sort_srg.all
  25. Вирусы
    ~/work/tmp/url_sort_vir.all
  26. Бактерии
    ~/work/tmp/url_sort_bak.all
  27. Гербы
    ~/work/tmp/url_sort_grb.all
  28. Флаги
    ~/work/tmp/url_sort_flg.all
  29. Языки Программирования
    ~/work/tmp/url_sort_lpr.all
  30. Моря
    ~/work/tmp/url_sort_sea.all
  31. Государства
    ~/work/tmp/url_sort_gos.all
  32. Озёра
    ~/work/tmp/url_sort_ozr.all
  33. Награды
    ~/work/tmp/url_sort_nag.all

Cвойства:
дата ⇔ 21.07.2016
FF ⇔ bts1003
страницы ⇔ документации Василисы ЯВИКС
страницы ⇔ дневники Василисы ЯВИКС
© 2014-2018 ЯВИКС - все права защищены.
Наши контакты/Карта ссылок