Övervakning av Telldus Core/Svc (fr. tråd "Slutter å hente..

Supportfrågor för server och klient (Windows, iPhone, Android, Linux).
Forum rules
För att kunna hjälpa dig med supportfrågor behöver vi så mycket information som möjligt.
Innan du skapar en ny tråd, läs gärna:
viewtopic.php?f=10&t=20
Post Reply
Martin
Administrator
Administrator
Posts: 2655
Joined: Tue 09 Nov 2010, 20:25

Övervakning av Telldus Core/Svc (fr. tråd "Slutter å hente..

Post by Martin » Fri 14 Sep 2012, 21:05

Edit: Delade tråden "Slutter å hente målinger fra kilder etter 2-3 dager" då diskussionen började gå in på detaljer för övervakning...

Man kan önska att det hade att göra med version (2.x eller 3.x), men tyvärr har det inte det.

Så här har jag fått förklarat för mig av Telldus angående hur det fungerar...

Tekniskt, visserligen, men ändå:
Telldus-bitarna består av en klientdel och en serverdel - Telldus Core och Telldus Service. När Telldus Center, Switch King och andra tredjepartsmjukvaror registrerar sig mot tjänsten använder dessa klientdelen - Telldus Core. Det innebär att mjukvaran (Switch King, Telldus Center eller annan) säger "hej, här är jag", och skapar en instans av Telldus Core. När väl mjukvaran skapat en instans av Telldus Core så används denna för att skicka kommandon och lyssna på data från serverdelen (Telldus Service).

Klienten - Telldus Core - ansvarar för att upprätthålla en kontakt med serverdelen och ska koppla upp igen om kontakten tappas (eller om tjänsten startas om).

Det jag har fått förklarat för mig är att problemet är att klientdelen - Telldus Core - tappar kontakten med serverdelen - Telldus Service, men problemet är att klientdelen inte förstår detta och den "återanslutningsfunktion" som finns inbyggd i Telldus Core därmed inte träder in och försöker rätta till problemet. Anslutningen mellan Switch King och Telldus Core fungerar, men anslutningen mellan Telldus Core och Telldus Service tappas.

De nya versioner som vi har fått av Telldus (varav den senaste just nu ligger här: http://telld.us/ellduservice3) loggar information som ska hjälpa till i felsökning för att komma fram till hur det kommer sig att TelldusCore inte förstår att anslutningen tappats.
Martin | Switch King

krambriw
4 stars
4 stars
Posts: 336
Joined: Thu 19 Jul 2012, 19:41

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by krambriw » Sat 15 Sep 2012, 06:35

Det verkar ju som om det fattas en bra watchdog funktion mellan Core och Service...men det kan dom väl inte ha missat?

Samtidigt, om jag stoppar servicen så får jag inget meddelande av Core om att så skett (eller så har jag missat att implementera det). Ser ni om ni får ett sådant i SK (alltså i utvecklingsmiljön) när ni stoppar servicen?

mvh

Martin
Administrator
Administrator
Posts: 2655
Joined: Tue 09 Nov 2010, 20:25

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by Martin » Sat 15 Sep 2012, 07:47

Om man stoppat tjänsten Telldus Service och försöker skicka en signal till en enhet har jag för mig att man får "Error connecting to Telldus Service" (om det är så du menar).
Martin | Switch King

krambriw
4 stars
4 stars
Posts: 336
Joined: Thu 19 Jul 2012, 19:41

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by krambriw » Sat 15 Sep 2012, 08:36

Kanske är en väg att aktivt övervaka funktionen, genom att periodiskt skicka ett kommando till en dummy enhet, men jag menade nog att man borde få information via ett callback på samma sätt som för vanliga events (dom borde kanske egentligen lägga till en separat system.callback för olika systemmeddelanden så att man kan följa och övervaka servicens status hela vägen genom Core).

Vad som redan är gjort och vad som behöver läggas till är väl något vi får be Telldus checka men jag skulle nog åtminstone vilja ha:

- separat callback för system meddelanden
- ett heartbeat som kommer periodiskt om allt är ok

Sedan borde naturligtvis Core och Service ha så pass bra intern kommunikation så att dom kan återansluta till sig själva. Service borde också kunna återstarta sig själv om den upptäcker något internt fel och Core kanske av samma anledning även skall kunna be Service om att återstarta sig. Eventuellt kanske även vi skulle kunna få tillgång till ett återstartskommando via api (istället för att tillgripa "Net Stop" via kommandotolken) men det kanske inte behövs om resten fungerar som det är tänkt.

mvh

Martin
Administrator
Administrator
Posts: 2655
Joined: Tue 09 Nov 2010, 20:25

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by Martin » Sat 15 Sep 2012, 08:58

Har också varit inne på heartbeat (och det syns nog i andra trådar ;)). Dock inte säker på att det löser problemet. När kommunikationen väl dör så räcker det inte alltid att omregistrera - i vissa fall går det, men i andra fall måste man stoppa Telldus Service innan nya prenumeranter kan ansluta.

Enklaste callback som man kan trigga är i princip att sätta namnet på en enhet. Sätter man namnet till samma namn som enheten redan har så påverkas inget, men man får ändå en callback. Det är dock inte helt trivialt att lägga till heartbeat-funktionalitet eftersom request går ut i en kö och kommer in i en annan. Man måste veta att ett event som kommer in är just ett "Heartbeat"-callback och därefter "göra något" om callback uteblir, eller markera status som "OK" om callback kommer in.
Martin | Switch King

krambriw
4 stars
4 stars
Posts: 336
Joined: Thu 19 Jul 2012, 19:41

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by krambriw » Sat 15 Sep 2012, 09:40

Man kanske kunde skapa ett application_name.HeartbeatDevice som ligger i systemet och som man som du säger byter namn på regelbundet, då vet man ju att callbacket hör till detta device. Sedan som du säger, en lämplig timer som löser ut om inte callbacket kommer tillbaka inom rimlig (relativt kort tid) och ett visst antal retries.

mvh

sege
2 stars
2 stars
Posts: 19
Joined: Mon 27 Aug 2012, 11:45

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by sege » Sat 15 Sep 2012, 11:43

På linux (ubuntu 10.04 LTS, telldus 2.1.1) verkar det ALLTID räcka med att starta om SW enbart för att få saker att lira. Där hade någon form av heartbeat/övervakning från SW's sida helt eliminerat problemet tror jag.

krambriw
4 stars
4 stars
Posts: 336
Joined: Thu 19 Jul 2012, 19:41

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by krambriw » Sun 16 Sep 2012, 06:39

Har labbat lite med övervakning av Telldus Service enligt nedan mest som test om/hur det skulle kunna ske baserat på diskussionen ovan.

Självklart löser inte detta grundproblemet men det kanske kan hjälpa våra system att fortsätta fungera om problemet uppstår.

Mitt labbande har jag gjort i EG genom att modifiera min Duo plugin. Den har nu stöd för att:
- vid start skapa en testenhet (eventGhost.HeartBeatDevice) i Telldus om den inte redan existerar
- periodiskt anropa enheten och sätta namnet på den
- kontrollera att det gick bra
- om det misslyckas, skapa en händelse som jag länkat till ett makro som försöker återstarta Telldus Service
- återskapa enheten om den raderas tex fån Telldus Center

I bilden nedan syns i tur och ordning:

- testenheten i Telldus Center
- makro definitionerna för återstart av Telldus Service med hjälp av net.exe
- händelse loggen i EG när problemet med Telldus Service upptäcks
Image11.jpg
För närvarande testas servicens funktion en gång i minuten (kanske lite ofta). För att provocera fram felet stoppar jag tjänsten manuellt, efter en stund är den igång igen. Om jag raderar testenheten blir den också återskapat inom en minut.

Så här långt fungerar det som väntat, nu får vi se om problemet uppträder på riktigt (kör den senaste versionen av servicen som finns på länken ovan).

mvh
You do not have the required permissions to view the files attached to this post.

fabz
3 stars
3 stars
Posts: 140
Joined: Fri 19 Aug 2011, 10:23

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by fabz » Sun 16 Sep 2012, 08:56

krambriw wrote:Har labbat lite med övervakning av Telldus Service enligt nedan mest som test om/hur det skulle kunna ske baserat på diskussionen ovan.

Självklart löser inte detta grundproblemet men det kanske kan hjälpa våra system att fortsätta fungera om problemet uppstår.

Mitt labbande har jag gjort i EG genom att modifiera min Duo plugin. Den har nu stöd för att:
- vid start skapa en testenhet (eventGhost.HeartBeatDevice) i Telldus om den inte redan existerar
- periodiskt anropa enheten och sätta namnet på den
- kontrollera att det gick bra
- om det misslyckas, skapa en händelse som jag länkat till ett makro som försöker återstarta Telldus Service
- återskapa enheten om den raderas tex fån Telldus Center
...
Du har inte möjlighet att dela med dig av EventGhost-filen här på forumet möjligen?

Martin
Administrator
Administrator
Posts: 2655
Joined: Tue 09 Nov 2010, 20:25

Re: Slutter å hente målinger fra kilder etter 2-3 dager

Post by Martin » Sun 16 Sep 2012, 09:24

sege wrote:På linux (ubuntu 10.04 LTS, telldus 2.1.1) verkar det ALLTID räcka med att starta om SW enbart för att få saker att lira. Där hade någon form av heartbeat/övervakning från SW's sida helt eliminerat problemet tror jag.
telldusd fungerar lite annorlunda än Telldus Service i Windows, vad jag har förstått, så det är nog anledningen till att det räcker att starta om.

@krambriw: Spännande :)
Martin | Switch King

Post Reply

Who is online

Users browsing this forum: Bing [Bot] and 19 guests