
Машина за търсене на технически документи
През цялата ни професионална кариера като архитекти, инженери, градостроители и др. Ще трябва да търсим в Интернет документация (книги, PDF, презентации и т.н.), за да извършим работа или просто като запитване.
Резултатите, получени в Интернет за определени търсения, не винаги ни предоставят информацията, която искаме, и, честно казано, можем да прекараме няколко часа в разглеждане на страници, където няма да стигнем до никъде или пълни със „спам“ (Вижте статията как да намерите книги по архитектура).
Онзи ден, разговаряйки с компютърен колега, той ни каза това Google ви позволява да създадете персонализирана търсачка за получаване на по-качествена информация ако знаеш малко програмиране. Веднага решихме, че имаме нужда от търсачка, специализирана в сектора на архитектурата, строителството, инженеринга, градоустройството и др. но че ще ни предоставите само документация.
За да разберем безплатния инструмент, който създадохме и който предоставя изключително документация, можем да видим следното изображение:

От тук започваме да работим за създаване на a инструмент във формат на търсачката че първо, беше напълно безплатно, и второ, че само ще ни предостави документация, свързана с архитектура, инженеринг, работи, и т.н.
Каква е машината за търсене на персонализирана документация?
Всъщност тя работи подобно на типичната търсачка на Google, където ще въведем термин "X" и това ще ни даде серия от резултати. За да го разберем схематично, създадохме следната инфографика:

Инструментът работи с всеки език. След като се въведе термин, Резултатите могат да бъдат филтрирани по тип документ (PDF, Word, Excel и др.) и по уместност или по дата, която е въведена в Интернет.
Каква документация ще намерим в инструмента?
На първо място, трябва да разберем, че търсачката филтрира информацията, която намираме в Интернет, когато търсим термин "X" в търсачката на Google.
Въпреки че има стотици различни файлове, които етикетират документи. Отстранихме най-често срещаните, които всички използваме, въведете файлове: .txt, .csv, .pdf, .ppt, .ppx, .pptx, .xls, .xml, .xlsx, .xltm, .doc, .docm, .docx.
Освен това сме включили два уеб портала, които хостват милиони документи на своите сървъри, ISSUU платформа и Slideshare, с тази особеност, че те са свободни за достъп и не е необходимо да се регистрираме, за да видим цялата документация. В инструмента ще видим няколко раздела и те са:
- Всички раздел. Всички документи са изброени тук, но те не са отстранени по тип файл.
- PDF раздел. Тук ще се показват само документи, маркирани като PDF
- Раздел DOC (Word).. Само документи на Microsoft Word ще се показват там, където сме включили с разширенията; .doc, .docm, .docx.
- Раздел Excel. Само документи на Microsoft Excel ще се показват там, където сме включили с разширенията; .xls, .xml, .xlsx, .xltm.
- Раздел „Презентации“.. Само документи, които са презентации във формат Power Point, ще се показват там, където сме включили с разширенията; .ppt, .ppx, .pptx.
- Раздел ISSUU. Тук ще се показват само документи, хоствани на платформата issuu.com (На тази платформа има всякакви видове документация; от презентации до пълни книги, например)
- Раздел за споделяне на слайдове. Тук ще се показват само документи, хоствани на платформата slideshare.net (На тази платформа има всякакви видове документация; от презентации до пълни книги, например). Имайте предвид, че този уебсайт принадлежи на LinkedIn и че повечето документи, които се качват на тази платформа, ще се показват в Slideshare.
Спомняме си, че в тази статия видяхме как да намерите докторски дисертации във всяка област и от организации или университети по целия свят.
Колко документа намираме, когато търсим в инструмента?
Въпреки че очевидно ще зависи от думата за търсене или фразата, информацията, хоствана на сървърите на Google и типа на файла, трябва да разберете нещо.

С инструмента можете да намерите 1200 документа за конкретна дума за търсене
Трябва да вземем предвид, че за да бъде безплатна търсачка, ние не използваме това, което се нарича „Google API“ или Google Academic поради ограниченията му. Но за всяка дума за търсене ще имаме 10 страници с 20 резултата, които ще бъдат индивидуални за всяка категория (Има 6 категории). Така че Максимумът документи за срок ще бъде 200 документа за категория, което, ако погледнем и умножим по отделните категории, бихме имали общо 1200 документа, които трябва да бъдат прегледани по термин за търсене луд!
Какво трябва да се вземе предвид в търсачката?
Когато тази търсачка е създадена в рамките на платформата на Google, ние посочваме ключови думи на търсачката. Ключовите думи описват съдържанието или темата на търсачката и се използват за фина настройка на резултатите по конкретни теми.
Включихме много термини, свързани с предмета на строителство, архитектура, строителство, инженеринг, индустриални въпроси, дизайн или въпроси на градоустройството.. За да дам пример, само за термина архитектура и свързаните с него теми:

Въпреки че в търсачката можете да практикувате търсения, които не са свързани с посочените по-горе теми, в действителност инструментът не е подготвен да предлага качествена информация в други общи сектори.
Друг проблем, който трябва да разберем, са резултатите с файловете, отнасящи се до разделите - категории: DOC (Word), Excel и Презентации (Power Point).
Според типа на файловете, които са (.doc, .docm, .docx, .xls, .xml, .xlsx, .xltm, .ppt, .ppx, .pptx) и как се държи при качването им в уебсайт, в 80% от случаите са и произвеждат директно изтегляне при щракване върху резултата (Това се случва и при нормално търсене в Google), за разлика от PDF (които се хостват на уебсайтове и ще ги видим от уебсайта, където се хоства).
Трябва също да коментираме, че за категориите Excel и Presentations (Power Point) не винаги ще намерим толкова резултати, колкото в другите раздели.
Къде мога да получа достъп до инструмента за персонализирано търсене?
Можете да го намерите от инструмента за търсене на конкретни документи от ТУК. Скоро ще го добавим в ДОМА на портала OVACEN, за да го направим по-достъпен за всички.
С този инструмент не измисляме нищо ново, но вярваме, че той може да бъде много полезен за тези хора, които искат да филтрират документи по подходящ начин и да намерят валидна документация, без да прекарват твърде много време в "гмуркане" в Интернет.
Ако ви е харесала тази статия, споделете я!