CYFROWY BARON • PROGRAMOWANIE

przez **Michalos** » niedziela, 21 grudnia 2008, 18:49

Witam!

Tworzę programik, którego zadaniem jest po podaniu linku do strony filmweb.pl zebrania potrzebnych informacji i wpisania ich do TEdita. Wczytanie źródła strony uzyskałem dzięki pakietowi Indy. Teraz rodzi się problem, jak wydobyć potrzebne informacje, pomyślałem o regexach, znalazłem bibliotekę Boost.Regex, ale niestety nie mogę jej prawidłowo dołączyć, wyskakuje komunikat:

[ILINK32 Error] Fatal: Unable to open file 'LIBBOOST_REGEX-BCB-MT-SD-1_37.LIB'

Mam:

Kod: Zaznacz cały: #include <boost/regex.hpp>

Pliki Boosta wgrywałem do katalogu BC/include i BC/lib

Może ktoś zna inne biblioteki do tego typu zastosowań, podam przykład wydobycia gatunku filmowego - nie mam jak sprawdzić czy działa:

Kod: Zaznacz cały: <strong> gatunek: <strong> <a href=".">([a-zA-Z0-9]+)</a>

Może ktoś często używa wyrażeń regularnych i jest chętny pomóc? A może ktoś poradzi jakąś inna technikę wydobywania potrzebnych informacji ze źródła strony (operacje na stringach?) ?

Pozdrawiam

A przyjrzałeś się poradzie:
► patrz serwis: Cyfrowy Baron dział: porady

sieć - internet

Wyciąganie adresów URL ze stron internetowych.

Zastosowałem tam parsowanie strony wczytanej do zmiennej AnsiString, po modyfikacji można wydobyć cokolwiek.

przez **wargo** » niedziela, 21 grudnia 2008, 20:13

Musisz umieścic plik w katalogu boost albo usunąć to ze ścieżki #include.

przez **Michalos** » niedziela, 21 grudnia 2008, 22:01

wargo napisał(a):Musisz umieścic plik w katalogu boost albo usunąć to ze ścieżki #include.

W katalogu boost mam ten plik

Jak nie miałem to był inny błąd

Co do propozycji Barona to troszkę dla mnie to za skomplikowane, zależy mi żeby dobrze opanować wyrażenia regularne z uwagi na to, iż to bardzo często może ułatwić pracę

Pytanie zasadnicze: czy skompilowałeś bibliotekę boost? 8-)

przez **Michalos** » poniedziałek, 22 grudnia 2008, 01:38

polymorphism napisał(a):Pytanie zasadnicze: czy skompilowałeś bibliotekę boost?

Co przez to rozumiesz?

Ano to rozumiem, że żeby skorzystać niektórych modułów z boost'a, trzeba je najpierw skompilować. Niewątpliwie regex do nich należy, czemu dał wyraz linker krzycząc o braku odpowiedniego LIB'a.

Niektóre biblioteki oprócz samego pliku - w Twoim przypadku regex.hpp wymagają dołączenia do projektu pliku LIB, jeżeli takowy wchodzi w skład biblioteki, stąd komunikat o błędzie: [ILINK32 Error] Fatal: Unable to open file 'LIBBOOST_REGEX-BCB-MT-SD-1_37.LIB', czyli powinieneś włączyć do projektu poprzez menu Project

Add to project bibliotekę LIBBOOST_REGEX-BCB-MT-SD-1_37.LIB. Jeżeli jej nie posiadasz, to musisz poszukać, ewentualnie sprawdź czy nie została dołączona biblioteka LIB o innej nazwie.

Kolejna sprawa, jeżeli umieszczasz bibliotekę w katalogu z programem to nie ujmuj jej w symbole <>, gdyż linkier będzie jej szukał w katalogu środowiska C++ Builder, gdyż te symbole to mu właśnie sugerują. Zamiast tego umieść bibliotekę w cudzysłowie:

#include "boost/regex.hpp"

Piszesz że umieściłeś pliki boosta w katalogach INCLUDE i LIB, więc ten problem nie powinien Ciebie dotyczyć. Zakładam jednak, że umieściłeś w katalogu LIB jakiś plik *.lib który trzeba właśnie dołączyć do projektu poprzez menu Project

Add to project.

Co do konieczności skompilowania biblioteki to polymorphism ma rację, jednak środowisko BCB począwszy od wersji 4 ma to do siebie, że automatycznie kompiluje wszystkie wymagające tego biblioteki dołączone do projektu podczas kompilacji tegoż projektu, Może o tym świadczyć chociażby fakt, że dołączając do projektu plik zasobów *.RES można zamiast skompilowanego pliku RES dołączyć wersję tekstową tegoż pliku czyli plik RC, kompilator skompiluje i automatycznie utworzy plik RES i dołączy do projektu. Podobnie jest z bibliotekami LIB.

Jeżeli jej nie posiadasz, to musisz poszukać, ewentualnie sprawdź czy nie została dołączona biblioteka LIB o innej nazwie.

Znaleźć to jej nie znajdzie, bo boost jest dostępny tylko w wersji do skompilowania (no, może poza VC, tu można sobie ściągnąć binarki specjalnie do tego stworzonym instalatorem). Dodawanie plików CPP do projektu też nie wchodzi w rachubę - jest to biblioteka duża i przede wszystkim multiplatformowa, co powoduje, że jest dużo zależności, które bez znajomości struktury całego boost'a mogą skutecznie uniemożliwić kompilację "ręczną". Szczególnie jeśli ktoś ma pierwszy raz do czynienia z kompilacją bibliotek.

Kolejna sprawa, jeżeli umieszczasz bibliotekę w katalogu z programem to nie ujmuj jej w symbole <>, gdyż linkier będzie jej szukał w katalogu środowiska C++ Builder,

Jeśli poprawnie zainstaluje tą bibliotekę, to będzie mógł załączać pliki przez #include <>. To kwestia poprawnego skonfigurowania środowiska, zmiennych środowiskowych itd.

Zakładam jednak, że umieściłeś w katalogu LIB jakiś plik *.lib który trzeba właśnie dołączyć do projektu poprzez menu Project Add to project

O Ile się nie mylę, w przypadku BCB, podobnie jak w VC, LIB'y mogą być załączanie z poziomu kodu źródłowego - odpowiednia dyrektywa #pragma. Więc wystarczy załączyć plik HPP i reszta sama się zrobi

Podobnie jest z bibliotekami LIB.

Niestety nie jest to prawdą.

Fakt. To coś więcej niż pojedyncza biblioteka.

Opis instalacji dla BCB 6

Uruchom konsolę CMD.

Przejdź do katalogu [...]<boost>\libs\regex\build - gdzie [...] to katalog w który znajduje się wypakowane archiwum boost, <boost> to katalog z podkatalogami bibliotek.

Wpisz polecenie: make -fbcb6.mak i poczekaj aż konsola zakończy działanie.

Teraz trzeba zainstalować biblioteki, w tym celu wpisz polecenie: make -fbcb6.mak install - biblioteki zostaną skopiowane do katalogu: LIB do <BCB_ROOT>/lib; DLL do <BCB_ROOT>/bin, gdzie <BCB_ROOT> to ścieżka systemowa środowiska BCB.

Na zakończenie możesz usunąć pliki tymczasowe wpisując polecenie: make -fbcb6.mak clean

W menu Tools

Options odszukaj zakładkę C++ Options a następnie Path and Directorie (używam BCB 2007 i nie pamiętam jak to jest dokładnie w BCB 6) przy polu Include path wciśnij przycisk [...] i w oknie które wyskoczy wprowadź ścieżkę dostępu do katalogu boost zawierającego biblioteki, np: c:\My_libraries\boost.

Gotowe! Możesz korzystać z bibliotek.

Powyższy opis dotyczy środowiska Borland C++ Builder 6, ale sprawdza się on równie dobrze dla środowiska BCB powyżej wersji 6.

"Zawsze nam się wydaje, żeśmy coś zrobili, ale wstrzymujemy się, kiedy pomoc jest najbardziej potrzebna."
Erich Maria Remarque

przez **Michalos** » poniedziałek, 22 grudnia 2008, 18:55

Dzięki wielkie, teraz już nie wywala błędów z brakiem bibliotek, mam pytanie skąd: Jak na to wpadłeś ?

Znalazłeś gdzieś w sieci, czy tak sie robi podobnie do innych bibliotek ? Chciałbym wiedzieć, żeby następnym razem nie musiał zawracać Wam głowy

Tego typu informacje prawie zawsze znajdziesz na stronie danego projektu.

Wystarczy czytać pliki Readme i zaglądać na stronę producenta. Jak widać tylko mi się chciało.

przez **Michalos** » środa, 24 grudnia 2008, 03:57

Których/ej funkcji użyć w celu wyciągnięcia ciągu znaków w podanym poniżej przykładzie w nawiasach?

Kod: Zaznacz cały: <strong> gatunek: <strong> <a href=".">([a-zA-Z0-9]+)</a>

przez **polymorphism** » środa, 24 grudnia 2008, 10:03

Chodzi ci o regex'a?

Tak na dobrą sprawę to nie wiem, czy wyrażenia regularne są do tego zadania potrzebne. Z tego co widzę, to chcesz zrobić zwykłe parsowanie tagów HTML'a, a tu wystarczy jakiś parser XML.

CYFROWY BARON • PROGRAMOWANIE

Regexy - wyrażenia regularne

Regexy - wyrażenia regularne

Re: Regexy - wyrażania regularne

Re: Regexy - wyrażania regularne

Re: Regexy - wyrażania regularne

Re: Regexy - wyrażania regularne

Re: Regexy - wyrażania regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Re: Regexy - wyrażenia regularne

Kto przegląda forum