
![]()
|
|
System Rozumienia Kształtów (SUS) – nowa generacja inteligentnych
systemów opartych na zdolności wizualnego myślenia
W chwili obecnej
projekt prowadzony jest w oparciu o własne środki autorów (Z. Les
i M. Les) to znaczy sprzęt komputerowy, oprogramowanie i wszystkie
koszty związane z prezentacją artykułów na konferencjach. Sprzęt i
korzyści płynące z zastosowania badań jak również
rezultaty badań są przedmiotem donacji autorów tego
projektu dla the Queen Jadwiga Foundation. Celem badań nad
Systemem Rozumienia Kształtów (SUS; ang. Shape Understanding System)
jest opracowanie metody rozumienia kształtów oraz jej implementacja
jako systemu zdolnego do wykonywania czynności związanych z
rozumieniem kształtów. W ramach rozumienia system powinien być
zdolny do uczenia się różnych koncepcji kształtu, do
zachowania tych koncepcji w strukturalnie zorganizowanej bazie wiedzy,
tworzenia procesu wyjaśniającego jak również wykonywania
pewnych operacji takich jak grupowanie obiektów czy też transformacja
form lingwistycznych do formy obrazowej. Interdyscyplinarne badania
nad SUS-em zawierają takie dziedziny jak psychologiczne teorie
percepcji, teoria znaków (semiotyka), rozpoznawanie i analiza obrazów,
computer vision jak również automatyczne pozyskiwanie wiedzy (ang.
machine learning). Metoda rozumienia kształtu będzie najbardziej
efektywna jeżeli będzie w stanie naśladować
działanie ludzkiego układu wzrokowego. Istniejące systemy
traktują kształt jako właściwość obiektu ze
świata rzeczywistego i starają się rozpoznać konkretny
obiekt. Proces rozumienia kształtu jest czymś odmiennym, bowiem
obejmuje stworzenie pojęcia kształtu w oparciu o dane zdobyte w
fazie uczenia jak również wykonywanie vizualnych transformacji w
procesie rozumienia. W wielu istniejących aplikacjach nie
odróżnia się kształtu od obiektu i bardzo często
wizualne systemy interpretują kształt jako sam obiekt. Metoda
rozumienia kształtów w przeciwieństwie do metod rozpoznawania
kształtu uwzględnia różne aspekty kształtu
reprezentowanego jako: podstawowa kategoria percepcyjna, znacząca
jednostka (zwana fantomem), podstawowa kategoria wizualna, idealna
reprezentacja kształtu generowana w oparciu o model danej klasy
kształtów (zwana archetypem), cyfrowa realizacja archetypu zwana
obiektem generowanym (ang. egzemplar), zbiór punktów krytycznych,
pojęcie wizualne (ang. visual concept), forma opisu kształtu
reprezentująca wiedzę wizualną, wskaźnik diagnostyczny.
W metodzie rozumienia kształtów różne reprezentacje kształtu
umożliwiają niezależne przebadanie każdej z nich jak
również ich wzajemnych powiązań. Rozumienie interpretowane
jest jako proces selektywnego pozyskiwania danych wejściowych
(percepcja), przekształcanie danych w celu przypisywania im znaczenia
w procesie wnioskowania (ang. visual reasoning), jak również
generowanie i przekształcanie danych w procesie wizualnych
transformacji (ang. visual transformations). Rozumienie kształtu,
gdzie kształt jest podstawową kategorią myślenia
wizualnego, składa się szereg złożonych procesów.
Jednym z głównych procesów jest tworzenie, na podstawie analizy
obiektu wizualnego (kształtu) jego symbolicznej reprezentacji i
przypisania mu znaczenia w formie pojęcia (ang. phantom concept). Prezentowana metoda jest
pierwszą w świecie próbą potraktowania kształtu jako
nie tylko ‘wizualnego atrybutu’ obiektu świata rzeczywistego ale
również podstawowej kategorii wizualnego myślenia (ang. visual
thinking) w aspekcie tworzenia systemów wizyjnych. Implementacja tej metody
w postaci Systemu Rozumienia Kształtu pozwala na wyposażenie
systemów komputerowych w jakościowo nowa metodę rozumowania
wizualnego (ang. visual reasoning). Do podstawowych pojęc
definiowanych w ramach opracowanej metody rozumienia kształtów naleza pojecia
takie jak: - fantom jako 2-wymiarowy
obiekt (ang. phantom) - klasy kształtów - archetyp (ang.
archetype) i generowany obiekt (ang. exemplar) - reguły
przydzielania badanego obiektu do klasy - znaczenie fantomu (ang.
phantom’s meaning). Wprowadzone nowe koncepcje
archetypu i generowanego obiektu, podkreślają różnicę
pomiędzy kształtem reprezentowanym w przestrzeni Euklidesowej a
jego reprezentacją cyfrową. Nowa metoda generowania
archetypu z wyraźnie zdefiniowanej klasy kształtów,
będących częścią hierarchicznej struktury klas
kształtów, pozwala generować kształt na podstawie
wyraźnie zdefiniowanej kategorii kształtów. Wprowadzone trzy
poziomy reprezentacji pozwalają na interpretację kształtu,
który można interpretować w kategoriach znaków albo obiektów
rzeczywistego świata. Metodologia interdyscyplinarna daje
zintegrowaną analizę kształtu z uwzględnieniem
epistemologicznego kontekstu związanego z rozumieniem kształtów. Metoda rozumienia
ksztaltow jest oparta na zdefiniowanej klasie kształtów. Kształt
jest reprezentowany przez swoją symboliczną nazwę,
związaną ze zbiorem możliwych klas kształtów. Zbiór
możliwych klas kształtów określa się na podstawie
znajomości „a priori” topologicznych i geometrycznych
właściwości kształtów, charakterystyki postrzeganej
figury oraz znaczenia kształtu jako formy znaczącej. Klasy
kształtów są definiowane w oparciu o wybrany model. W
proponowanej metodzie rozumienia kształtu możliwe klasy
kształtu traktuje się jako hierarchiczną strukturę,
gdzie na każdym poziomie opisu model kształtu obejmuje różne
aspekty kształtu takie jak geometryczne właściwości
kształtów, własności percepcyjne figur czy znaczące
właściwości form wizualnych. Klasa kształtów a priori
tworzona jest w oparciu o model danej klasy. Jako przyklad zdefiniowanych
klas ksztaltow na poziomie meta-klasy mozemy wyroznic: klasę
cykliczną, acykliczną, wypukłą, wklęsłą
i cienką. W obrębie meta klas wyróżniono klasy podstawowe i
szczegółowe oraz opracowano metodę otrzymywania klas na kolejnych
poziomach opisu.
1 2 3 4 Rysunek 1: Przykłady generowanych
obiektów (exemplars) generowanych z meta klas 1. acykliczna 2. wypukła 3. wklęsła 4.
cienka W prezentowanej metodzie wprowadzony
jest szczegółowy opis cyfrowej reprezentacji archetypu i
różnicę pomiędzy kształtem reprezentowanym w
przestrzeni Euklidesowej (ang. archetyp) a jego reprezentacją
cyfrową (ang. exemplar). Wprowadzone pojęcie transformacji obrazu
(ang. image transformation) definiuje metodę przekształceń w
dyskretnej przestrzeni punktów krytycznych. Transformacje obrazu
stanowią główną część procesu wizualnego
wnioskowania. Istotą transformacji obrazu jest wyznaczenie punktów
krytycznych charakterystycznych dla danej klasy. Wprowadzone pojecie
transformacji obrazu pozwala na sformalizowanie opisu procesu wnioskowania
oraz na generalizację i łatwą adaptację owego
formalizmu w pokrewnych dziedzinach badań. W oparciu o otrzymany zbiór
punktów krytycznych badany obiekt przydzielany jest do danej klasy
kształtów przez przypisanie mu reprezentacji symbolicznej (ang.
symbolic name). Jednym z aspektów analizy
kształtu jest reprezentacja i opis kształtu. W proponowanej
metodzie rozumienia kształtu opis kształtu związany jest z
jedną z możliwych klas kształtu. Metoda rozumienia
kształtu uwzględnia różnice w przetwarzaniu różnych
klas kształtu w toku procesu rozumowania. Do rozpoznawania kształtu
proponowano wiele metod przetwarzania, ale opracowane one były do
stosowania dla szerokiego zakresu klas kształtu, co bardzo często
prowadziło do niezbyt zadowalających wyników. W proponowanej w
pracy metodzie rozumienia kształtów zastosowano nowe sposoby
przetwarzania obrazu i modyfikację istniejących metod
przetwarzania obrazu do wybranych klas kształtów. Dla każdej z
klas kształtów opracowano sekwencję metod przetwarzania, która
daje najlepsze wyniki. Ponieważ system opiera się na
wykorzystaniu wielu różnych złożonych i wzajemnie
zależnych metod pozyskiwania danych i podejmowania decyzji, to
każdą z metod przetwarzania stosuje się do bardzo
konkretnego zadania. Przydzielenie badanego
obiektu do jednej z klas jest wykonywane w kolejnych etapach procesu
wnioskowania (rozumowania). W procesie wnioskowania stosuje się
obrazowe transformacje w celu otrzymania zbioru punktów krytycznych,
wyznacza się zbiór deskryptorów i przydziela badany obiekt do jednej z
klas Przedstawiony System
Rozumienia Kształtów SUS, stanowiący realizację metody
rozumienia kształtów, potrafi wykonywać różne zadania w
zakresie analizy i rozpoznawania kształtów w oparciu o swoją
zdolność rozumienia różnych koncepcji kształtu na
różnych poziomach poznania. System obejmuje różnego rodzaju
umiejętności, pozwalające na wykonywanie różnych
zadań w zakresie przetwarzania i rozumowania. Symboliczne nazwy, nawiązujące
do możliwych klas kształtów, pozwalają na wyrażenie
pojęcia wizualnego jako zbioru symbolicznych nazw. Pojęcie
wizualne, wyrażone jako zbiór symbolicznych nazw, można
wykorzystać do znalezienia wizualnych podobieństw pomiędzy
różnymi obiektami wizualnymi i do zapamiętania wizualnego obiektu
jako symbolicznej reprezentacji. Proponowany system rozumienia
kształtów, zrealizowany w języku C++ w systemie operacyjnym
Windows 2000, działa na podstawie znajomości przetwarzania
obrazów, podejmowania decyzji i strategii poszukiwań oraz
znajomości opisu i reprezentacji kształtu przez różne
wyspecjalizowane moduły (ang. experts) takie jak, dla przykladu
‘reasoning expert’, ‘processing expert’, ‘learning expert’ czy
‘self-correcting expert’. Podstawowy cel systemu SUS to tworzenie
pojęcia kształtu, umożliwiającego wizualne wnioskowanie
i przekształcenia wizualne. System SUS analizuje obiekt wizualny celem
zinterpretowania go w kategoriach symbolicznych nazw możliwych klas.
Wielopoziomowe reprezentacje zapewniają nowy, efektywny sposób komunikowania
się systemu z użytkownikiem (osobą lub z innym systemem).
Nowa architektura systemu ma na celu maksymalną współpracę
ekspertów, uczestniczących w rozwiązywaniu problemu
epistemologicznego. Metoda testowania i autokorekcji oparta jest na
rozumowaniu polegającym na generowaniu obiektu z zadanej klasy i
sprawdzaniu czy system w trakcie rozumowania przypisze ten obiekt do
właściwej klasy. Nowa metoda rozumowania, gdzie przetwarzanie
jest częścią procesu rozumowania, ma stanowić element
nowej architektury systemów rozumienia. Proponowaną metodę
realizuje się jako System Rozumienia Kształtów,
umożliwiający budowę systemu rozumienia, w którym wszystkie
nowe ustalenia testowane są w kontekście całego
istniejącego zasobu wiedzy. W pierwszym etapie prac
przetestowano zdolność rozumienia przez system koncepcji,
związanych z meta klasami (cykliczno-acykliczna,
wypukło-wklęsłą, cienką). W drugim etapie
przetestowano zdolność rozumienia przez system koncepcji, jakie
można sformułować stosując pojęcie kształtu.
Wyniki dowodzą, że system SUS potrafi zrozumieć takie
koncepcje jak wypukłość, wklęsłość i
cienkość, reprezentowane przez
klasy ogólne „a priori”. System potrafi zrozumieć co oznacza bycie
„wielobokiem”, „elipsą”, „prostokątem”, „prostokątem z
zaokrąglonymi narożami”, „wielobokiem wklęsłym” oraz
wiele innych pojęć, związanych z określonymi klasami
kształtów. System potrafi zrozumieć takie koncepcje jak
„wypukłość”, „kształt bez otworu”, „kształt
cienki” „trojkat z dwoma otworami w ksztalcie okregu”. Opisywany system
wykonał bezbłędnie różne zadania w zakresie rozumienia
(np. rozpoznanie, grupowanie obiektów podobnych, nazywanie). Zadania te
sformułowano w kategoriach pojęcia kształtu (np. stawiane
zadanie „znaleźć wszystkie obiekty wypukłe”). Zdolność systemu
do rozumienia pojęcia kształtu, związanego z konkretnymi
obiektami, przetestowano w toku procesu autokorekcyjnego rozumowania. Próby
przeprowadzono dla klasy wieloboków wklęsłych i klasy cienkiej i
cyklicznej. W pierwszej fazie przetestowano zdolność zrozumienia
przez system różnicy pomiędzy wielobokami wklęsłymi i
nie wklęsłymi, a w fazie drugiej zdolność rozumienia
koncepcji wieloboku wklęsłego. Wyniki wskazują, że
proponowana metoda sprawdza się w przypadku klasy wieloboków
regularnych. W przypadku klasy wieloboków nieregularnych występuje
problem z reprezentacją cyfrową wygenerowanego archetypu. Wyniki wskazują,
że system jest zdolny do wykonania zadań wymagających
„umiejętności” rozumienia. Najtrudniejsza sprawa to nazywanie i
znajdowanie obiektów podobnych. Nazwy bardziej skomplikowanych form
wizualnych podano jako wyrażenie lingwistyczne, np. „kwadrat z
okrągłym otworem”, albo „dwie połączone elipsy”. W
przypadku obiektu cyfrowego, który można zinterpretować na
poziomie znaku albo na poziomie referencyjnym rzeczywistego świata,
ilość możliwych interpretacji dla niektórych obiektów
cyfrowych jest znaczna. System byl również
testowany w zakresie rozumiena pojęcia wybranych kategorii znakowych
np. litery, znaki drogowe, symbole matematyczne, pismo klinowe, hieroglify
oraz inne systemy znakowe. Bardzo ważnym aspektem rozumienia jest
interpretacja gdzie ten sam obiekt wizualny jest interpretowany w
różny sposób. Interpretacja uzależniona jest od uprzednio
pozyskanej kontekstualnej informacji i jest jedną z pierwszych prób
naśladowania ludzkiego umysłu w interpretacji wizualnej
zależnej od nastawienia poznawczego. System byl również
testowany w zakresie rozumiena obiektow trójwymiarowych jak również
obiektów realnego swiata. Chociaż obiekty świata rzeczywistego
jawią się jako obiekty trójwymiarowe jednakże postrzeganie
trójwymiarowości jest problemem który można badać
abstrachując od pojęcia obiektu świata rzeczywistego.
Rozumienie obiektów świata rzeczywistego włączone jest w kontekst
rozumiena znaków i jawi sie jako szerszy problem rozumienia znaczenia
elementów postrzeganego świata. Jednym z najtrudniejszych
zadań jest testowanie wizualnych transformacji które są
częścią wizualnego myślenia i jednym z
najważniejszych elementów wizualnego rozwiązywania problemów jak
również częścią procesów związanych z twórczym
myśleniem (wyobrażnia). Wstępne testy dowodzą że
wykorzystanie podstawowych wizualnych kategorii (klas ksztaltow) pozwoli na
prowadzenie skomplikowanych wizualnych transformacji prowadzących w
konsekwencji do procesu wizualnego myślenia. System rozumienia
kształtów jest w stanie wykonywać różne zadania w zakresie
analizy i rozpoznawania kształtu na podstawie swojej zdolności
rozumienia różnych koncepcji kształtu na różnych poziomach
poznania. Opracowany system obejmuje różnego rodzaju
umiejętności wykonywania rozmaitych zadań w zakresie
przetwarzania i rozumowania. System ma zdolność uczenia się
różnych pojęć kształtów i zachowywania ich w
strukturalnie zorganizowanej bazie wiedzy. System wykorzystuje szereg
różnych złożonych i wzajemnie od siebie zależnych metod
zdobywania danych, rozumowania i wyjaśniania. Reprezentacje
wielopoziomowe pozwalają dawać wyjaśnienia
użytkownikowi na różne sposoby, naśladujące sposób
„zrozumiałego” wyjaśniania. Działanie systemu daje lepszy wgląd
w rolę rozumienia w procesie wizualnej percepcji. Metoda wskazuje,
że do zrozumienia kształtu istotne są nie tylko cechy
percepcyjne obiektu, ale również sposób przetwarzania i rozumowania,
zależny od klasy do której obiekt należy. System Rozumienia Kształtów
SUS można stosować w wielu dziedzinach, gdzie analizę obrazu
można sprowadzić do analizy kształtów np. w statystyce,
medycynie, naukach ścisłych i astronomii. |
Copyright the Queen Jadwiga Foundation
Adres:
The Queen Jadwiga Foundation
![]()