Doorgaan naar hoofdcontent

Excel: performance of hoe optimaliseer ik grote spreadsheets III

Onderzoek bij een groot bedrijf: Excel binnen netwerk

Na een onderzoek bij een groot bedrijf in Zwolle naar performance problemen bij het gebruik van Excel, is me eens te meer duidelijk geworden dat we onderscheid moeten maken tussen de performance van losse spreadsheets en de performance van Excel in een netwerkomgeving met veel gebruikers.

In dit geval is er sprake van een Citrix omgeving. Probleem hier is dat diverse servers regelmatig onderuitgehaald worden het gebruik van Excel. De oorzaken waren niet duidelijk.

Bevindingen

Na onderzoek blijkt Excel door een beperkt aantal mensen met enige regelmaat gebruikt te worden voor het analyseren van zeer grote hoeveelheden data (tot wel een miljoen regels). Gevolg: zeer grote bestanden met flinke aantallen berekeningen. Zowel laad- als opslagtijd lopen dan flink op. Ook het herberekenen van formules leidt tot een forse piekbelasting. Binnen de Citrix omgeving ondervinden andere gebruikers hier flink last van.

Aanbevelingen

Excel is in de eerste plaats een instrument voor ad hoc toepassingen: kleinere rekenmodellen met grafieken en overzichten maar met beperkte hoeveelheden data. Hoewel het pakket zich er wel voor lijkt te lenen, is het binnen een netwerk-omgeving niet geschikt voor data-analyse met grote hoeveelheden opgeslagen data.

Concrete mogelijkheden

  • Het gebruik van de standaard add-in Power Pivot zou het gebruik van externe (lees o.a. CSV) aanmerkelijk versnellen en de gebruikte Excel bestanden ook veel kleiner kunnen houden.
  • Er kunnen in Excel ook koppelingen gelegd worden via Analysis Services (SSAS); ook dat houdt de bestandsgrootte beperkt.
  • Bij gebruik van grote hoeveelheden data met veel bewerkingen is het raadzamer over te schakelen op Access
  • Automatisch herberekenen uitzetten, al kan dit tot misverstanden leiden. Normaal gesproken is dit bij kleinere modellen ook niet nodig.
  • Foutcontrole op achtergrond uitzetten leidt bij grotere bestanden tot een geringere belasting.












Reacties

Populaire posts van deze blog

Excel: VBA script om wachtwoord te verwijderen

Af en toe krijg ik een vraag om een wachtwoord van een Excel blad te halen. Doodsimpel met VBA. Hier een script dat ik gebruik: Sub WachtwoordCrack()     Dim a As Integer, b As Integer, c As Integer, d As Integer, _     e As Integer, f As Integer, g As Integer, h As Integer, _  I As Integer, j As Integer, k, m As Integer     Dim begin As Date, eind As Date     Dim duur As String     Dim objSheet As Worksheet     begin = TimeValue(Time)     On Error Resume Next     For Each objSheet In Application.Worksheets         For a = 65 To 66: For b = 65 To 66: For c = 65 To 66             For d = 65 To 66: For e = 65 To 66: For f = 65 To 66                 For g = 65 To 66: For h = 65 To 66: For I = 65 To 66                     For j = 65 To 66: For k = 65 To...

Excel 2013: uniek aantal in draaitabel

Tot en met versie 2010 was het in Excel lastig om in een draaitabel een uniek aantal (DISTINCT COUNT) te tellen. We geven een voorbeeld op basis van een verkoperslijst. In deze lijst kunnen we zien welke verkopers welke artikelen hebben verkocht. Willen we nu in een draaitabel laten zien hoeveel artikelen een verkoper heeft verkocht, dan krijgen we wel de aantallen maar niet de unieke aantallen te zien. Om toch de unieke aantallen te laten zien, hebben we een aantal stappen nodig. Op het moment dat we de draaitabel invoegen, krijgen we in Excel 2013 dit dialoogvenster: Onderaan zien we daar een nieuwe optie: Deze gegevens toevoegen aan het gegevensmodel . Deze optie moeten we aanvinken, voor we op OK klikken. We krijgen dan een iets ander beeld dan normaal: Normaliter krijgen we alleen de veldnamen. Nu zien we er het woord Bereik boven staan. Voor het voorbeeld heb ik nu Verkoper toegevoegd aan Rijen en Artikelomschrijving aan Waarden . Het resultaat is identiek...

Excel: gegevenslabel alleen bij de laatste waarde in een grafiek

Creatief met Corona Bij het maken van een grafiek over de voortschrijdende Corona cijfers in Nederland liep ik tegen een probleem aan. Als je bij een reeks gegevens in een grafiek de gegevenslabels aan zet, krijg je die labels bij elke waarde. Ik wilde dit label alleen bij de laatste waarde tonen. Nu kun je natuurlijk alle andere gegevenslabels afzonderlijk wissen, maar dat is een hoop werk. Op zoek naar een andere manier dus. De cijfers datum aantal 1-3-2020 3 2-3-2020 8 3-3-2020 5 4-3-2020 15 5-3-2020 44 6-3-2020 46 7-3-2020 60 8-3-2020 76 9-3-2020 57 10-3-2020 61 11-3-2020 121 12-3-2020 111 13-3-2020 190 14-3-2020 155 15-3-2020 176 16-3-2020 278 17-3-2020 292 18-3-2020 250 19-3-2020 20-3-2020 21-3-2020 22-3-2020 23-3-2020 24-3-2020 25-3-2020 ...