Да започнем с основния въпрос - какво е база данни(БД)?

...
Да започнем с основния въпрос - какво е база данни(БД)?
Коментари Харесай

Осем технологии, които променят базите данни




Да стартираме с главния въпрос - какво е база данни(БД)? Навремето беше елементарно да се даде определение. Тогава беше задоволително да има един човек, който поставя данни в таблица с доста прави редове и отвесни колони. Дълги, безкрайни правоъгълници от информация, отправили взор към бъдещето.

Релационната БД стана основата на модерните калкулации. Повечето уеб сайтове съставляват една фасада от CSS, зад която стои SQL. Голяма част от нещата, които ни карат да се усещаме специфични, е просто още един ред в огромната таблица на живота.

Любовната спекулация с огромната матрица от битове постепенно замира, а разработчиците схващат, че не всичко може да се постави в таблица. И тъй като те са умни и се стремят да намерят решение на всички проблеми, търсят по-добри места за депозиране на информацията.

През последните няколко години се появиха доста решения за предпазване и отбрана на данните.

Те обаче слагат редица въпроси – може ли да назовем „ база данни “ новите и хубави благоприятни условия? Нужно ли е още данните да бъдат напъхани в една огромна матрица, с цел да станат БД? Някои анализатори употребяват понятието „ магазин за данни “, с цел да разграничат актуалните начини, защото „ база данни “ е прекомерно тясно обвързвано със остарялата таблична конструкция.

Ето 8 метода, базата данни да бъде излята в нови форми и стандарти.

GPU компютинг

Навремето, видео картите бяха конструирани, с цел да обслужват работата на графичните приложения, само че в този момент така наречен графични процесори правят доста неграфична обработка.

Търсенето на данни е единствено една от неграфичните интервенции, за които постоянно се употребяват. И за какво – не?

Да се трансферират безкрайните купчини данни, в търсене на сходство, е паралелна интервенция, формирана от доста обикновени задания, които се повтарят милиони пъти. Доста елементарно е да включите в осъществяването на задачата хиляди процесори в GPU-то.

Ползата не в това да се извърши всяка обособена поръчка (което не лишава доста време), а в подготвителната работа, тъй като съвсем не се постанова предварителна обработка.

Много бази с данни пестят време като поддържат лист, който на процедура е прогнозният резултат от всяко допустимо търсене. Ако този лист се повреди или унищожи, възобновяване му може да изисква часове, дни или даже - месеци.

При състояние, че данните се побират в паметта на GPU, нормално може да минете и без показателя. В случай, че данните се трансформират бързо, огромна част от листата ще остане неизползваема. Тогава, прескачането на подготовката ще се окаже доста дейно.

Разгледайте MapD, Kinetica, Brytlyt и други, с цел да видите дали данните и търсенето могат да станат по-бързи.

Енергонезависима памет (NVRAM)

Преди 50 години, задачата на програмистите е била доста по-лека. Не им се е налагало да трансферират данни сред RAM-a и диска на машината, благодарение на комплицирани протоколи, осигуряващи поредност. Тогава паметта беше „ желязната “ вътрешност и нямаше заплаха от загуба на информация, в случай че спре зареждането. Добрите остарели времена могат да се върнат в скоро време, тъй като производителите на чипове, приказват за подмяна на RAM с NVRAM или енергонезависима памет.

Това е огромна смяна на играта пред програмистите на складове за данни, тъй като едно от главните провокации, е заплахата от загуба на информация. Според упованията, БД ще станат по-бързи, тъй като обработката на транзакциите ще се опрости.

Други гравитират към концепцията за вграждане на лог за възобновяване, откакто данните бъдат записани в медията, само че не преди този момент.

Засега никой не може да каже какво ще излезе от тази пушилка. Ще употребяват ли хората още бази с данни, в случай че не се нуждаят от непрестанен запис? Търсенето и индексирането ще ги накара ли да се върнат към БД? Всички логаритми и архитектури, по всяка възможност ще бъдат преосмислени. Кой ще е най-хубавият метод за потребление на NVRAM – ще стане ясно почти след десетилетие.

Разширяване на SQL

Когато стартира модата на нерелационните бази данни NoSQL, едно от огромните преимущества беше, опцията да съхранявате информацията в разнообразни възли.

Cassandra и MongoDB, ни накараха да мислим, че в случай че получим характерностите на огромните скалируеми складове, би трябвало да загърбим комфортния свят на SQL.

Всъщност, сходен компромис е непотребен. Ако при най-ранните опити, огромните скалируеми БД се създаваха по-лесно без целия SQL багаж, няма причина, заради която SQL да не върви добре на няколко машини, работещи с голям масив от информация.Компании като Oracle вършат това от години.

Новите хиперскалируеми бази, разрешават да употребявате знанията и опита си със SQL, плюс удобството да работите с набор от данни, разпределени в огромен клъстер. При CockroachDB, да вземем за пример, поръчките постъпват посредством общоприета SQL машина, която достъпва копираните в голям брой възли данни с валидирането на ACID. Разбира се, ще платите известна цена за поддръжката, която ви подсигурява компактност на данните, само че не чак толкоз.

Ако гаранциите за компактност са значими за работата ви, огледайте артикули като CockroachDB, Гугъл Cloud Spanner, Clustrix, Azure SQL, and NuoDB.

Геопространствени бази данни

Традиционно, базите данни са планувани за едноизмерни масиви, а не за двумерните координати от географията. Но можете да „ излъжете “ и общоприета БД и да я накарате да извършва не изключително комплицирани задания с географски координати.

Пробвайте да сложите в обособени колони параметрите за широчина и дължина: по този начин ще можете да търсите по редове, които съдържат кафези, дефинирани от широчина и дължина. Но в случай че желаете да отидете оттатък тези съществени данни, общоприетите SQL поръчки не правят работа.

Геопространствените бази данни имат няколко спомагателни функционалности, които вършат търсенето, сортирането и разширеното търсене в двумерното пространство доста по-лесно. Пространствените показатели, да вземем за пример, нормално работят посредством прибавяне на решетка над координатната област, с цел да се търси доста по-бързо по редове, прилежащи на двуизмерни и триизмерни данни.

Тези показатели вършат допустимо да подавате запитвания с интервенции като " съдържа ", " припокрива " и даже " допира " с множества, дефинирани от полигони. Всичко това прави описанието на действителния свят доста по-ефективно.Neo4j Spatial, GeoMesa, MapD, и PostGIS са доста положителни за начало.

Графи

Таблиците са добър метод за предпазване на данни, само че не правят работа, в случай че задачата е да се сътвори нова огромна база, като тези, които се употребяват в интернет.

Тъй като по този начин нареченият " обществен граф " избухва, товарим компютъра си още възли и връзки сред тях. И връзките постоянно са по-важни от данните в тях. Съхраняването и извличането на връзка сред двойка възли, се прави елементарно при класическа релационна база данни, само че по-сложните поръчки са невъзможни. По отношение на връзките с приятелите, Боб е на две или три „ крачки “ от Крис в обществената мрежата. Дали Мери се среща с някогашния на някоя от приятелките си?

Графите вършат сходни поръчки лесни за осъществяване. Няма потребност от безпределно добиване на данните от таблици, тъй като връзките дефинират къде да попадне поръчката. Инструменти като Neo4J, OrientDB и DataStax са единствено някои от вариантите, които в този момент се броят на пръстите на две ръце. Те имат свои лични езици за поръчки също.

Облачни БД

Една от най-големите промени е в метода, по който купуваме програмен продукт за бази данни. В предишното купувахме лични машини и подписахме лицензионни съглашения за потребления програмен продукт. Сега фирмите за облачни услуги оферират предпазване на информация, която не можем да забележим и докоснем. Просто ни споделят, че данните ще бъдат там, когато ги потърсим.

Предимствата са явни. Няма потребност да се поддържа сървър или нужното за задачата помещение. Дори може да забравите грижите за лицензирането, конфигурирането и инсталирането на ъпдейти. Някой различен се занимава с всичко това. Решението постоянно е и по-евтино - изключително в случай че нямате огромно количество данни. Услугите нормално се таксуват съгласно заетото пространство.

Но заплахите, в случай че има такива, лежат в сенките. Има ли някой различен достъп до данните? Защитен ли е сървърът от токов удар, гръмотевични стихии или наводнения? Архивират ли се надеждно данните? За всичко това, би трябвало да се доверите на доставчика на облаци.

Основните снабдители на подобен вид услуги Гугъл, Microsoft и Amazon оферират и дълъг лист от услуги за бази данни. Наскоро Oracle, MongoDB и DataStax също пуснаха бази данни в облак.

Изкуствен разсъдък (AI)

Казват, изкуственият разсъдък е единствено термин за най-новото потомство проучвания, които лабораториите бълват към производителите. Има редица нови артикули и решения, украсени с думи като " машинно образование " или " невронни мрежи " или " надълбоко учене ". Те може да не наподобяват като база данни, само че единствено ги запълнете с данни и им задайте въпроси. Защо не?

Добрата вест при решенията с изкуствен интелект е, че не е нужно да знаете какво тъкмо търсите. Просто да размахвате ръката и си пожелавате нещо нездравословно или " най-интересното " или " най-близкото ". Няма потребност да притежавате точния ключ, така наречен референтен номер, който хората за обслужване на клиенти постоянно ви молят да запишете.

Лошата вест е, че няма да знаете дали сте получили верния отговор, тъй като не сте задали въпроса прецизен въпрос. Това известие ли е в действителност най-интересно? От друга страна, най-голямата загадка за триумфа на Гугъл е, че няма безспорен верен отговор.Списъкът с инструментариума за машинно образование е прекомерно дълъг, с цел да го бъде изложен. Винаги можете да попитате обичаната си търсачка за " най-интересното " AI.

Блокчейн

Понятието блокчейн постоянно се гарнира със комплицираната стопанска система и политика на Bitcoin, само че зад всички диалози за криптовалути, това е един извънредно постоянен, удобен и добре спретнат „ магазин “ за данни. Всеки има късмет да актуализира данните в дългата маса и всеки може да споделя отговора. Вълнуващо е, че всички споделят едни и същи отговори. Това е идеално за бизнеса, тъй като който съперниците се държат другарски.

Редица разработчици отиват по-нататък и приказват за " интелигентни контракти ", което е различен метод да се каже, че битовете в базата данни са задоволително надеждни, с цел да могат да се употребяват в юридическата сфера. Това е непостижимо с елементарна база данни, която може да бъде изменена от всеки с администраторски права.

Има обаче слаби места. Всеки консуматор би трябвало да поддържа ключ за кодиране, защото всички транзакции би трябвало да бъдат подписани цифрово. Ако този ключ се изгуби или не помни, данните в тези редове се замразяват вечно. Ако този ключ бъде откраднат, всички залози биват изключени. Блокчейн не е съвършен, с други думи, само че е доста по-надежден от общоприетия модел.

R3, Ripple и IBM са единствено трима от многото съперници, които изследват пространството. Много от водещите банки имат свои лични вътрешни планове. А компании като Bitcoin и Altcoin, също са огромна част от екосистемата.

Източник: computerworld.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР