Ankündigung

Einklappen
Keine Ankündigung bisher.

DATENBANKSPEZI PLS MS SQL 2008 R2

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

    DATENBANKSPEZI PLS MS SQL 2008 R2

    HI HILFE PLS

    Wir hatten heute in unserem Bereich eine Großstörung, da die Datenbankfestplatte vollgelaufen ist. Um dies zu verhindern, haben wir eigentlich einen Job, der alle 10 Minuten die veralteten Daten aus der Datenbank löscht.

    Störung bestand seit 13:00 Uhr.

    Als ich um 14:30 Uhr meine Schicht antrat, wurde ich dann auch gleich zur Problemstelle gerufen. Als ich dort ankam, war die Datenbank schon unbedienbar.
    Nachdem ich dann ein bisschen Platz auf der Platte geschaffen hatte (manuelles wegkopieren von Log-Datein und Backups), konnten wir die Datenbank "shrinken".

    Nachdem die Datenbank dann wieder i.O. war, kam natürlich die Frage: WIESO passiert das. Nun analysiere ich gerade das Problem und stelle folgendes fest:

    Am 29.07.2016 steht in der History des Jobs als Message:
    " The job was stopped prior to completion by User sa. The Job was invoked by Schedule 37 (Every10Minutes). The last step to run was step 1 (DS_SP_DeleteOldData)

    Message im Step Name - DS_SP_DeleteOldData:
    Excecuted as user: NT-AUTORITÄT\SYSTEM. The Step was cancelled (stopped) as the result of a job request.

    Duration: 10:07:25:00

    Am 08.08.2016 steht in der History des Jobs als Message:
    "The job was stopped priro to completion by User sa. The Job was invoked by user sa. [...]

    Message im Step Name - DS_SP_DeleteOldData
    Excecuted as user: NT-AUTORITÄT\SYSTEM. The Step was cancelled (stopped) as the result of a job request.

    Dies sieht nun so aus als hätte der User sa (Admin) diesen Job beendet. Dieser User ist aber nur ein Kollege und ich. Und der Kollege hat Urlaub.

    Frage: Wie kann ich meinem Chef erklären, dass sich dieser Dienst beendet hat? Der JOB ACTIVITY LOG scheint sich nach dem reboot meiner Kollegen überschrieben zu haben..

    Hilfe..??

    #2
    Der Job Request bzw. der cancel kann doch auch von einem Dienst ausgelöst worden sein der als Authentifizierung den sa verwendet. Woher wollt ihr wissen das dies eine Person ausgelöst hat.

    Kommentar


      #3
      Was Zero sagt, ist auch wahrscheinlich.. klingt aber für mich auch nicht nach einem durchdachten system

      Kommentar


        #4
        Kommt eben davon, wenn man sich ein System samt Infrastruktur von einer Firma verkaufen lässt, wo man nicht einmal zu 100 % weiß, welche Devices mit was kommuniziert und welche Daten wirklich effektiv in die DB geschrieben werden.

        Das was Zero sagt, wird es auch gewesen sein. Das Problem an der Sache ist nur, dass wird mir mein Chef nicht glauben. Der nutzt jede Gelegenheit um gegen mich zu schießen, weil ich ihn des öftern schon wegen des Systems bzw. dem Aufbau der Infrastruktur, Backup-Strategie etc. auflaufen lassen habe. Auch bei höheren Vorgesetzten.

        Der wird probieren, mir das anzuhängen, dass das ein manueller Eingriff von mir war. Deshalb die Frage ob es vlt. noch ein Log gibt, welches ich nicht kenne / bedenke.

        Kommentar


          #5
          Zitat von p15s
          Kommt eben davon, wenn man sich ein System samt Infrastruktur von einer Firma verkaufen lässt, wo man nicht einmal zu 100 % weiß, welche Devices mit was kommuniziert und welche Daten wirklich effektiv in die DB geschrieben werden.

          Das was Zero sagt, wird es auch gewesen sein. Das Problem an der Sache ist nur, dass wird mir mein Chef nicht glauben. Der nutzt jede Gelegenheit um gegen mich zu schießen, weil ich ihn des öftern schon wegen des Systems bzw. dem Aufbau der Infrastruktur, Backup-Strategie etc. auflaufen lassen habe. Auch bei höheren Vorgesetzten.

          Der wird probieren, mir das anzuhängen, dass das ein manueller Eingriff von mir war. Deshalb die Frage ob es vlt. noch ein Log gibt, welches ich nicht kenne / bedenke.
          Vielleicht solltest du eher in Betracht ziehen, deine Firma zu wechseln oder eine Aussprache zu suchen.
          Es gibt auch Logs, in denen man die Logins sieht. Die Zeiten kannst du mit deinen oben Abgleichen und hast dann die Antwort. Es wird immer User SA stehen und wenn dein Chef nicht versteht, wie Dienste funktionieren dann hast du Pech gehabt.
          Die Dienste werden sogar, falls schlecht eingerichtet, vom SA ausgeführt. Dies ist die Default Einstellung beim Installieren einer neuen Instanz in SQL 2k8.

          edit.: Was mich umso mehr schockt. Es hört sich so an, als ob du Administrator bist und eine Schicht von deinen Kollegen übernommen hast. Wie zum Teufel kriegen es deine Kollegen nicht hin, die VHD, LUN, w/e zu erweitern bzw. TreeSizeFree drüber laufen zu lassen und die Logs erstmal zu bereinigen???? Man sieht doch mit Sicherheit sofort, dass der Server voll läuft.
          Funktioniert euer Skript? Laufen evtl. die Transaktionlogs voll und eure Sicherung bereinigt diese Logs nicht?

          Kommentar


            #6
            Sowas wie Festplattenplatz sollte auch eigentlich überwacht werden, da würde ich mich nicht blind auf ein Job verlassen. Oder der Job sollte überwacht werden. Zumindest sollte man irgendwas überwachen und sich nicht blind darauf verlassen, dass es schon funktionieren wird.

            Wie viel Wissen hat dein Chef denn? Was will er denn dagegen sagen, wenn du ihm das erklärst?

            Kommentar


              #7
              Zitat von DerKiLLa
              Sowas wie Festplattenplatz sollte auch eigentlich überwacht werden, da würde ich mich nicht blind auf ein Job verlassen. Oder der Job sollte überwacht werden. Zumindest sollte man irgendwas überwachen und sich nicht blind darauf verlassen, dass es schon funktionieren wird.

              Wie viel Wissen hat dein Chef denn? Was will er denn dagegen sagen, wenn du ihm das erklärst?
              Ohja. Den Punkt habe ich sogar vergessen. Bei jeder größeren Firma gib es auch eine Überwachung, richtig. Hört sich für mich sehr chaotisch an, was TE da beschreibt.

              Kommentar


                #8
                Grundsätzlich würde der User in der Meldung stehen der das gemacht hat, also in der einen die du gepostet hast. Diese wäre nur nicht der Fall, wenn er explizit Impersonifizierung verwendet hat (oder tatsächlich mit einem Service Account irgendwo angemeldet war).

                Habe dir das hier mal demonstriert:

                Kommentar


                  #9
                  Zitat von Montell_Jordan
                  Zitat von p15s
                  Kommt eben davon, wenn man sich ein System samt Infrastruktur von einer Firma verkaufen lässt, wo man nicht einmal zu 100 % weiß, welche Devices mit was kommuniziert und welche Daten wirklich effektiv in die DB geschrieben werden.

                  Das was Zero sagt, wird es auch gewesen sein. Das Problem an der Sache ist nur, dass wird mir mein Chef nicht glauben. Der nutzt jede Gelegenheit um gegen mich zu schießen, weil ich ihn des öftern schon wegen des Systems bzw. dem Aufbau der Infrastruktur, Backup-Strategie etc. auflaufen lassen habe. Auch bei höheren Vorgesetzten.

                  Der wird probieren, mir das anzuhängen, dass das ein manueller Eingriff von mir war. Deshalb die Frage ob es vlt. noch ein Log gibt, welches ich nicht kenne / bedenke.
                  Vielleicht solltest du eher in Betracht ziehen, deine Firma zu wechseln oder eine Aussprache zu suchen.
                  Es gibt auch Logs, in denen man die Logins sieht. Die Zeiten kannst du mit deinen oben Abgleichen und hast dann die Antwort. Es wird immer User SA stehen und wenn dein Chef nicht versteht, wie Dienste funktionieren dann hast du Pech gehabt.
                  Die Dienste werden sogar, falls schlecht eingerichtet, vom SA ausgeführt. Dies ist die Default Einstellung beim Installieren einer neuen Instanz in SQL 2k8.

                  edit.: Was mich umso mehr schockt. Es hört sich so an, als ob du Administrator bist und eine Schicht von deinen Kollegen übernommen hast. Wie zum Teufel kriegen es deine Kollegen nicht hin, die VHD, LUN, w/e zu erweitern bzw. TreeSizeFree drüber laufen zu lassen und die Logs erstmal zu bereinigen???? Man sieht doch mit Sicherheit sofort, dass der Server voll läuft.
                  Funktioniert euer Skript? Laufen evtl. die Transaktionlogs voll und eure Sicherung bereinigt diese Logs nicht?
                  richtig. ich bin gelernter Fachinformatiker und hatte die Schicht übernommen. Offiziell aber nicht für IT Aufgaben innerhalb unserer Abteilung zuständig, weil ich mich dadurch ins Angestelltenverhältnis klagen könnte. Meine Kollegen, von denen ich übernommen hatte, sind TECHNIKER. Sollten also zumindest von SQL Datenbanken schon einmal was gehört haben.

                  Frag mich nicht, das erste was die gemacht haben war. AEG. Ausschalten, einschalten, geht (nicht).
                  Der SQLAGENTLOG wird sich vermutlich nach dem reboot überschrieben haben. Das Skript habe ich jetzt wieder zum laufen bekommen, kann trotzdem nicht sinn der Sache sein, eine datenbank nicht redundant laufen zu lassen (was sie normalerweise ja auch ist).

                  Es gab allerdings schon mal eine Datenbankstörung, wo sich der Mirroring-Dienst aufgehangen hat und somit den zweiten Server aufgrund von Schreibzugriff "gesperrt" hat, heißt: das Failover-Cluster hat nicht funktioniert, das Transaktionsprotokoll konnte auf eine unbestimmte Größe anschwillen und hat die Festplatte geflutet. Deshalb hat man damals gesagt, dass wird abgeschaltet um dem aus dem Weg zu gehen. Ich hatte eindringlich davor gewarnt, sogar bei dem Chef meines Chefs.

                  Zitat von Montell_Jordan
                  Zitat von DerKiLLa
                  Sowas wie Festplattenplatz sollte auch eigentlich überwacht werden, da würde ich mich nicht blind auf ein Job verlassen. Oder der Job sollte überwacht werden. Zumindest sollte man irgendwas überwachen und sich nicht blind darauf verlassen, dass es schon funktionieren wird.

                  Wie viel Wissen hat dein Chef denn? Was will er denn dagegen sagen, wenn du ihm das erklärst?
                  Ohja. Den Punkt habe ich sogar vergessen. Bei jeder größeren Firma gib es auch eine Überwachung, richtig. Hört sich für mich sehr chaotisch an, was TE da beschreibt.
                  Ein Monitoring-System ala PRG, WhatsUp Gold, oder von mir aus auch kostenloses NAGIOS, hatte ich vorgeschlagen. Abgelehnt. Weil braucht man nicht.

                  Mein Chef ist gelernter Mechaniker. Ich arbeite in der Instandhaltung Elektrik / IT. Deshalb hat der Typ auch keine Ahnung, was er da für ein Risiko eingeht. Wir hatten heute einen 4-Stündigen Produktionsausfall. Aber das muss er ja seinem Chef erklären. Nicht ich.

                  Und die Kosten pro Stunde Produktionsausfall gehen in die tausende.




                  Zitat von Crumaro
                  Grundsätzlich würde der User in der Meldung stehen der das gemacht hat, also in der einen die du gepostet hast. Diese wäre nur nicht der Fall, wenn er explizit Impersonifizierung verwendet hat (oder tatsächlich mit einem Service Account irgendwo angemeldet war).

                  Habe dir das hier mal demonstriert:
                  danke an dich, werde ich morgen mal so ausführen.

                  Kommentar


                    #10
                    PRTG ist auch kostenlos ;D

                    Würde in solch einem Fall mal zu seinem Chef gehen und nach einem Überwachungssystem fragen im Hinblick auf den Produktionsausfall und die damit verbundenen Kosten.

                    Kommentar


                      #11
                      danke trotzdem schon mal an alle. habe jetzt feierabend, werde mir jetzt ne shisha gönnen und mich abregen. Meine Techniker Kollegen wussten natürlich alles besser.. :D

                      Und anstatt direkt den momentanen nich aktiven Datenbankserver zu restoren, mit Backups, die die Datenbank ja Wöchentlich und auch täglich fährt, FULL und DIFF, haben sie einfach nichts gemacht.

                      Das war mein erster Ansatz um die Produktion wieder zum laufen zu bekommen, um mich danach in Ruhe um den Server zu kümmern. Wurde aber auch abgelehnt.. :D manchmal könnte ich denen ins gesicht springen.

                      Kommentar


                        #12
                        Zitat von DerKiLLa
                        PRTG ist auch kostenlos ;D

                        Würde in solch einem Fall mal zu seinem Chef gehen und nach einem Überwachungssystem fragen im Hinblick auf den Produktionsausfall und die damit verbundenen Kosten.
                        Ja. aber nur für eine gewisse Anzahl an Sensoren, natürlich ist die Kostenlose Variante auch eine Überlegung. Aber wie gesagt. Nein. Brauch man nicht :D

                        Kommentar


                          #13
                          am liebsten hätte ich meinem Chef vorhin auch gesagt, dass hast du Vollidiot jetzt davon, dass du keine Anständige Betreuung für das Netzwerk (mehr) willst, da kannste ja mal mit deinem verschissenen BWL Studium rechnen, was wir hier an Geld verlieren..

                          BAAAH ich könnte Kotzen!!

                          Kommentar


                            #14
                            Ist leider gängige Praxis das an Prävention gespart wird bis mal was passiert. Das ist dann aber auch der Moment wo man gute Argumente hat dafür zu investieren :D

                            Kommentar


                              #15
                              Hättest doch auch im AD schauen können wann und wo der User zu diesem Zeitpunkt angemeldet war, um deinem Chef zu beweisen das du es nicht warst.

                              Glaub mir es könnte dich viel schlimmer treffen.... Arbeite aktuell in einem Projekt mit einem großen IT Dienstleister mit 2 Buchstaben (Ok die Tochter hat mittlerweile 3 Buchstaben) bei einer deutschen Bank und so wie die beiden Parteien arbeiten wäre ich froh in deiner Lage zu sein ;-)

                              Kommentar

                              Lädt...
                              X